新書推薦:

《
制造规则 : 国际标准建立背后的历史与博弈
》
售價:HK$
96.8

《
货币与政府
》
售價:HK$
129.8

《
昨日今朝(网络原名:今朝欢愉)
》
售價:HK$
54.8

《
靖难之役:明朝初年的改革、削藩、政争与叛乱
》
售價:HK$
85.8

《
斗罗宇宙全解:斗罗大陆IP官方设定集百科全书
》
售價:HK$
163.9

《
新民说·我也只是一个人
》
售價:HK$
74.8

《
数学史这样教
》
售價:HK$
87.9

《
高能量家庭
》
售價:HK$
32.9
|
內容簡介: |
《智能计算架构与软件栈》全面介绍智能计算架构与软件栈的基本原理和应用。内容涵盖:智能计算系统的基础知识,主要包括定义、发展历程;计算机体系结构基础,详述了指令系统、存储系统、流水线技术和并行计算;AI加速器原理,重点介绍了发展历史、设计思路、优化设计和性能评价;AI加速器架构,深入分析了单核和多核架构;AI编译器的工作原理和设计方法;基于TVM的定制化AI编译器的设计;两个海洋智能计算的实验案例。
|
目錄:
|
目录第1章 概述 11.1 智能计算系统 11.1.1 智能计算系统的概念 11.1.2 智能计算系统的发展 21.2 智能计算系统中的硬件与软件 41.2.1 智能计算系统中硬件的角色 41.2.2 智能计算系统中软件栈的角色 6思考题 8第2章 计算机体系结构基础 92.1 指令系统 92.1.1 指令系统概述 92.1.2 数据表示 122.1.3 寻址方式 152.1.4 指令类型与指令格式 172.2 存储系统 202.2.1 存储系统概述 202.2.2 存储器技术与优化 212.2.3 缓存性能与优化 232.2.4 虚拟存储器 262.3 流水线 282.3.1 流水线概述 282.3.2 流水线性能 312.3.3 流水线中的相关 352.4 并行 392.4.1 并行度与并行体系结构分类 392.4.2 指令级并行 412.4.3 数据级并行 522.4.4 分布式并行训练系统 62思考题 68第3章 AI加速器原理 693.1 AI加速器概述 693.1.1 AI加速器的发展 693.1.2 AI加速器的设计思路 713.2 目标算法分析 723.2.1 计算特征 723.2.2 访存特征 753.3 AI加速器优化设计 803.3.1 运算部件设计 803.3.2 稀疏化设计 843.3.3 低位宽与混合精度设计 853.4 性能评价 863.4.1 性能指标 873.4.2 测试基准程序 873.4.3 影响性能的因素 88思考题 89第4章 AI加速器架构 904.1 单核AI加速器架构 904.1.1 总体架构 904.1.2 运算模块 924.1.3 存储与控制模块 944.2 多核AI加速器架构 974.2.1 总体架构 984.2.2 Cluster 架构 994.2.3 互联架构 1034.3 AI加速器实例 1054.3.1 Google TPU 1054.3.2 TVM-VTA 1064.3.3 NVDLA 1084.3.4 华为昇腾AI处理器 109思考题 111第5章 AI编译器基础 1125.1 传统编译器工作流程 1125.1.1 LLVM编译器前端 1125.1.2 LLVM编译器中间表示 1145.1.3 LLVM编译器后端 1165.2 AI编译器原理 1195.2.1 AI编译器的结构与特征 1195.2.2 AI编译器前端技术 1205.2.3 AI编译器后端与运行时 137思考题 158第6章 AI编译器设计 1596.1 TVM系统设计 1596.1.1 TVM概述 1596.1.2 TVM的计算图优化 1616.1.3 TVM的计算与调度 1656.1.4 TVM的自动调优框架 1666.2 华为MindSpore软件栈设计 1706.2.1 图算融合 1706.2.2 融合算子加速优化框架AKG 173思考题 175第7章 基于TVM的定制化AI编译器 1767.1 TVM前端扩展 1767.1.1 数据表示实现 1767.1.2 自定义算子实现 1797.2 TVM后端及运行时扩展 1837.2.1 代码生成的定制化开发 1837.2.2 运行时的定制化开发 1917.2.3 集成第三方硬件加速库 196思考题 213第8章 海洋智能计算实验 2148.1 海洋智能信号预处理算子开发实验 2148.1.1 实验目的 2148.1.2 背景介绍 2148.1.3 实验内容与步骤 2188.2 海洋目标检测应用开发实验 2198.2.1 实验目的 2198.2.2 背景介绍 2198.2.3 实验内容与步骤 223参考文献 226
|
|