昇騰 AI 處理器應用與開發實踐

楊建磊

  • 出版商: 人民郵電
  • 出版日期: 2025-06-01
  • 售價: $539
  • 語言: 簡體中文
  • 頁數: 256
  • ISBN: 7115654654
  • ISBN-13: 9787115654656
  • 相關分類: 人工智慧
  • 下單後立即進貨 (約4週~6週)

  • 昇騰 AI 處理器應用與開發實踐-preview-1
  • 昇騰 AI 處理器應用與開發實踐-preview-2
昇騰 AI 處理器應用與開發實踐-preview-1

相關主題

商品描述

本書圍繞昇騰AI處理器開發應用實踐目標,不僅系統性地講述全棧AI 計算技術體系,還深入淺出地介紹工程化的開發方法與技術。

本書首先介紹基礎知識,包括人工智能基礎、深度學習技術、智能計算技術等;其次介紹AI 處理器基礎知識,包括神經網絡加速原理、深度學習芯片架構、深度學習軟件棧、全棧AI計算技術體系等;再次介紹昇騰AI處理器軟硬件架構,包括達芬奇架構、昇騰310/910處理器架構、昇騰開發軟件棧與工具鏈等;最後介紹昇騰AI 處理器開發流程及編程方法。此外,本書還詳細介紹昇騰AI 開發實踐案例,包括開發環境部署、基礎模型開發案例、模型進階開發探索、輔助工具應用實踐等。本書提供配套資源,包括工程示例、源代碼、平臺配置信息等,旨在為讀者提供體系化的實踐訓練,讓讀者能夠學以致用,快速形成全棧AI開發的系統能力。

本書可作為高等院校電腦、人工智能、雲計算、大數據等相關專業的教材,也可作為ICT培訓機構智能計算方向的教材,還可作為人工智能領域從業人員的參考書。

作者簡介

楊建磊,教授、博士生導師、國家級青年人才,現任職於北京航空航天大學電腦學院。博士畢業於清華大學電腦系,曾在美國匹茲堡大學從事博士後研究。主要研究方向為電腦體系機構、集成電路設計、智能芯片與系統等。主持國家級和省部級科研項目10餘項,在電腦與集成電路領域的高水平學術會議與期刊上發表論文100餘篇,獲得國際學術會議競賽獎項2次、國際學術會議優秀論文獎或提名獎4次。主講“電腦組成”“電腦系統基礎”“智能計算體系結構”“深度學習系統”等課程,入選“教育部產學合作協同育人項目優秀案例”“教育部產學合作協同育人項目十周年典型案例”,獲得“教育部產學合作協同育人項目”華為優秀成果獎、“北京航空航天大學優秀教學成果”一等獎。連續8年被評為“龍芯杯全國大學生電腦系統能力培養大賽”優秀指導教師,2次被評為“北京市普通高校優秀本科畢業設計(論文)優秀指導教師”,指導本科生成功設計並流片3款CPU處理器芯片。

目錄大綱

第 1章 引言 1

1.1 人工智能基礎 1

1.1.1 人工智能概述 1

1.1.2 人工智能發展簡史 2

1.1.3 人工智能的主要方向 6

1.2 深度學習簡介 7

1.2.1 深度學習基本原理 8

1.2.2 深度學習典型模型 10

1.2.3 深度學習主要應用 16

1.3 人工智能計算概述 17

1.3.1 人工智能計算需求 17

1.3.2 人工智能計算技術特徵 18

1.3.3 人工智能計算系統發展趨勢 19

參考文獻 20

第 2章 AI處理器基礎 23

2.1 神經網絡加速原理 23

2.1.1 通用計算芯片架構的局限性 23

2.1.2 專用計算芯片架構潛力 25

2.1.3 神經網絡計算加速技術 27

2.2 深度學習芯片 29

2.2.1 通用計算芯片 29

2.2.2 專用計算芯片 34

2.2.3 顛覆性計算芯片 37

2.3 深度學習軟件棧 40

2.3.1 深度學習模型框架 40

2.3.2 深度學習編譯框架 44

2.3.3 深度學習模型部署優化框架 46

2.4 全棧AI計算技術體系 50

2.4.1 軟硬件協同設計思想 50

2.4.2 深度學習系統設計與優化方法 52

2.4.3 典型驅動範例:昇騰AI全棧技術方案 53

參考文獻 55

第3章 昇騰AI處理器硬件架構 57

3.1 硬件架構概述 57

3.2 達芬奇架構 58

3.2.1 AI Core整體架構 59

3.2.2 計算單元 60

3.2.3 存儲系統 63

3.2.4 控制單元 66

3.2.5 指令系統 68

3.3 昇騰AI處理器邏輯架構 70

3.3.1 昇騰310處理器邏輯架構 70

3.3.2 昇騰910處理器邏輯架構 72

參考文獻 73

第4章 昇騰AI處理器軟件架構 75

4.1 軟件框架概述 75

4.2 軟件工具鏈 77

4.2.1 MindStudio開發環境 77

4.2.2 昇騰計算語言 79

4.2.3 昇騰張量編譯器 81

4.2.4 算子生成與優化器 82

4.2.5 運行管理與任務調度器 84

參考文獻 88

第5章 昇騰AI處理器開發流程 89

5.1 昇騰AI開發平臺介紹 89

5.2 昇騰AI推理開發流程 91

5.2.1 工具與環境部署 92

5.2.2 基於MindX SDK的推理開發流程 94

5.2.3 基於AscendCL的推理開發流程 98

參考文獻 99

第6章 昇騰AI處理器編程方法 101

6.1 昇騰編程模型與語言庫 101

6.1.1 AscendCL功能架構 101

6.1.2 AscendCL API 102

6.1.3 AscendCL應用擴展 104

6.1.4 AscendCL示例:以模型推理流程為例 105

6.2 張量編譯器(ATC) 114

6.2.1 ATC內部原理 114

6.2.2 ATC功能介紹 115

6.2.3 ATC應用示例 119

6.3 張量優化與算子開發 121

6.3.1 算子模型定義 123

6.3.2 自定義算子開發與優化 128

6.3.3 算子開發編程方式 129

6.4 模型部署與推理優化 136

6.4.1 模型遷移流程 136

6.4.2 自動部署與模型調優 137

6.5 功能輔助增強組件 138

6.5.1 模型預處理 138

6.5.2 數據預處理 143

參考文獻 144

第7章 實踐案例 145

7.1 開發環境部署 145

7.1.1 實驗軟硬件準備 145

7.1.2 開發環境部署流程 147

7.1.3 運行環境部署流程 152

7.1.4 模型訓練流程 157

7.1.5 模型推理流程 159

7.2 基礎模型開發實例 165

7.2.1 圖像分類應用實例:C++/Python實現 165

7.2.2 目標檢測應用實例:C++/Python實現 179

7.2.3 語音處理應用實例:C++/Python實現 185

7.2.4 模型遷移實例:以ONNX/PyTorch為例 190

7.2.5 模型輕量化開發實踐 198

7.3 模型進階開發探索 204

7.3.1 自定義算子實例:以BatchNorm算子為例 204

7.3.2 算子開發:以Transformer為例 235

7.3.3 算子優化技術:以算子融合為例 238

7.4 輔助工具應用實踐 243

7.4.1 精度比對工具 243

7.4.2 性能分析工具 245

7.4.3 專家系統工具 246

參考文獻 248