深入理解電腦視覺:關鍵算法解析與深度神經網絡設計
張晨然
- 出版商: 電子工業
- 出版日期: 2023-04-01
- 定價: $834
- 售價: 8.5 折 $709
- 語言: 簡體中文
- 頁數: 432
- ISBN: 7121452588
- ISBN-13: 9787121452581
- 
    相關分類:
    
      Computer Vision
 
立即出貨
買這商品的人也買了...
- 
                
                   $203電腦視覺 — Python + TensorFlow + Keras 深度學習實戰 (微課視頻版) $203電腦視覺 — Python + TensorFlow + Keras 深度學習實戰 (微課視頻版)
- 
                
                   OpenCV 影像創意邁向 AI 視覺王者歸來 (全彩印刷) OpenCV 影像創意邁向 AI 視覺王者歸來 (全彩印刷)$890$703
- 
                
                   PyTorch 深度學習:電腦視覺流行專案親自動手 PyTorch 深度學習:電腦視覺流行專案親自動手$780$616
- 
                
                   $551自動駕駛算法與芯片設計 $551自動駕駛算法與芯片設計
- 
                
                   Python + OpenCV — 機器學習 + 深度學習 40大電腦視覺案例入門到實戰 Python + OpenCV — 機器學習 + 深度學習 40大電腦視覺案例入門到實戰$1,200$948
- 
                
                   動手學深度學習 (PyTorch 版) 動手學深度學習 (PyTorch 版)$659$626
- 
                
                   $356電腦視覺 — 飛槳深度學習實戰 $356電腦視覺 — 飛槳深度學習實戰
- 
                
                   $760深入理解電腦視覺:在邊緣端構建高效的目標檢測應用 $760深入理解電腦視覺:在邊緣端構建高效的目標檢測應用
- 
                
                   自動駕駛:感知原理與實踐 自動駕駛:感知原理與實踐$648$616
- 
                
                   $454擴散模型:生成式 AI 模型的理論、應用與代碼實踐 $454擴散模型:生成式 AI 模型的理論、應用與代碼實踐
- 
                
                   視覺慣性 SLAM 實作 - 原始程式剖析真正讀懂理論 視覺慣性 SLAM 實作 - 原始程式剖析真正讀懂理論$980$774
- 
                
                   AWS 自學聖經:5大必學雲端主題・超圖解入門 (全彩印刷) (第二版) AWS 自學聖經:5大必學雲端主題・超圖解入門 (全彩印刷) (第二版)$750$593
- 
                
                   AI + IoT 佈建邊緣運算 - 電腦視覺業界專案原理及實作 AI + IoT 佈建邊緣運算 - 電腦視覺業界專案原理及實作$980$774
- 
                
                   $709機器學習高級實踐:運算廣告、供需預測、智慧行銷、動態定價 $709機器學習高級實踐:運算廣告、供需預測、智慧行銷、動態定價
- 
                
                   萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰 萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰$1,280$1,011
- 
                
                   $714PyTorch 自動駕駛視覺感知算法實戰 $714PyTorch 自動駕駛視覺感知算法實戰
- 
                
                   API 設計模式|簡化整合的訊息交換技術 (Patterns for API Design: Simplifying Integration with Loosely Coupled Message Exchanges) API 設計模式|簡化整合的訊息交換技術 (Patterns for API Design: Simplifying Integration with Loosely Coupled Message Exchanges)$850$672
- 
                
                   演算法導論, 4/e (Introduction to Algorithms, 4/e) 演算法導論, 4/e (Introduction to Algorithms, 4/e)$1,800$1,422
- 
                
                   $454大規模語言模式開發基礎與實踐 $454大規模語言模式開發基礎與實踐
- 
                
                   機器視覺偵測與辨識技術及應用 基於深度學習 機器視覺偵測與辨識技術及應用 基於深度學習$479$455
- 
                
                   ChatGPT 4 Omni 領軍 - Copilot、Claude、Gemini、36組GPT ...全面探索生成式AI的無限可能(過版書) ChatGPT 4 Omni 領軍 - Copilot、Claude、Gemini、36組GPT ...全面探索生成式AI的無限可能(過版書)$780$616
- 
                
                   輕量又漂亮的 Python Web 框架 - Streamlit AI 時代非學不可 輕量又漂亮的 Python Web 框架 - Streamlit AI 時代非學不可$690$545
- 
                
                   內行人才知道的機器學習系統設計面試指南 (Machine Learning System Design Interview) 內行人才知道的機器學習系統設計面試指南 (Machine Learning System Design Interview)$680$537
- 
                
                   世界第一簡單的演算法:圖解 ✕ 程式 ✕ 刷題機器人 世界第一簡單的演算法:圖解 ✕ 程式 ✕ 刷題機器人$599$473
- 
                
                   決戰半導體:解讀大數據時代的強勢版塊,掌握未來投資趨勢 決戰半導體:解讀大數據時代的強勢版塊,掌握未來投資趨勢$480$360
相關主題
商品描述
本書對二維、三維目標檢測技術涉及的骨乾網絡及入門必備的電腦視覺算法進行全面的介紹。本書由淺入深地介紹了MNIST、ImageNet、CIFAR、波士頓房產、ModelNet等經典二維、三維數據集和相關國際賽事,還介紹了TensorFlow中的二維捲積層、全連接層、激活層、池化層、批次歸一化層、隨機失活層的算法和梯度下降原理,AlexNet、VGG、ResNet、DarkNet、CSP-DarkNet等經典骨乾網絡的設計原理,以及PointNet、GCN等三維電腦視覺神經網絡。此外,本書通過設計巧妙且具體的案例,讓讀者穩步建立紮實的編程能力,包括數據集的製作和解析、神經網絡模型設計能力和開銷估算、損失函數的設計、神經網絡的動態模式和靜態模式的訓練方法和過程控制、神經網絡的邊緣計算模型量化、神經網絡的雲計算部署。完成本書的學習,讀者可以繼續閱讀與本書緊密銜接的《深入理解電腦視覺:在邊緣端構建高效的目標檢測系統》,將所學的電腦視覺基礎知識運用到目標檢測的神經網絡設計中,對邊緣計算環境下的神經網絡進行遊刃有餘的調整。
目錄大綱
目錄
第1篇  電腦視覺開發環境的搭建	1
第1章  Python編程環境	2
1.1  Python語言簡介	2
1.2  Python腳本的運行方式	3
1.3  Anaconda虛擬環境管理器	3
1.4  使用Anaconda建立虛擬環境	5
第2章  搭建三層的圖像分類神經網絡	7
2.1  下載數據集	7
2.2  探索數據集	8
2.3  構建、編譯和訓練神經網絡	9
2.4  使用神經網絡進行批量預測	12
2.5  將預測結果可視化	13
第2篇  電腦視覺模型從實驗室到生產環境的部署	15
第3章  圖片數據集的處理	16
3.1  數據集的預處理	16
3.1.1  下載和查看數據集	16
3.1.2  準備花卉類別名稱和類別序號的對應關系	17
3.1.3  準備花卉圖片和類別名稱的對應關系	18
3.2  數據集的製作	20
3.2.1  擬寫入數據集的數據	20
3.2.2  TFRecord格式的數據集	21
3.2.3  單個樣本的生成函數	24
3.2.4  批量生成樣本並寫入TFRecord文件	26
3.3  數據集的讀取和驗證	27
3.3.1  解析單個樣本	27
3.3.2  製作函數批量解析樣本	30
3.4  數據管道的優化處理	31
第4章  遷移學習和神經網絡的設計	35
4.1  遷移學習的概念和花卉分類應用	35
4.2  下載MobileNet	36
4.3  設置MobileNet	38
4.4  測試MobileNet的特徵提取輸入和輸出	39
第5章  損失函數的基礎原理	42
5.1  回歸場景下常用的損失函數	42
5.2  回歸場景下的損失函數實戰	44
5.3  分類場景下的損失函數	47
5.3.1  概率、幾率、對數幾率的概念	47
5.3.2  對數幾率和概率的相互轉換	49
5.3.3  多標簽與單標簽分類問題	51
5.3.4  單標簽分類問題和交叉熵算法原理	52
5.3.5  交叉熵損失函數	54
5.4  自定義損失函數	56
第6章  神經網絡的編譯和訓練	58
6.1  神經網絡的編譯	58
6.2  神經網絡的訓練	59
6.2.1  神經網絡訓練的基本概念	59
6.2.2  神經網絡訓練的常用回調機制	60
6.2.3  訓練的返回和過擬合的觀測	62
6.3  神經網絡的保存	65
6.3.1  神經網絡保存的格式和命令	65
6.3.2  神經網絡的性能測試和推理	72
第7章  TensorFlow模型的部署方式	74
7.1  以Edge TPU為例進行邊緣端模型部署	75
7.1.1  將模型轉換為TFLite格式	75
7.1.2  針對邊緣硬件編譯模型	77
7.1.3  模擬邊緣端推理	79
7.1.4  配置邊緣計算開發板Edge TPU	81
7.1.5  編寫邊緣端推理代碼	85
7.1.6  將推理代碼下載到開發板並運行	87
7.2  在服務器端部署模型	89
7.2.1  TensorFlow Serving的安裝和使用	89
7.2.2  網絡推理請求和響應實戰	92
第3篇  神經網絡的數學原理和TensorFlow計算框架	95
第8章  神經網絡訓練的數學原理和優化器	96
8.1  損失函數和神經網絡訓練的本質	96
8.1.1  神經網絡函數的數學抽象	96
8.1.2  計算損失函數極值的數學抽象	97
8.2  使用符號微分法獲得損失值的全局最小值	98
8.3  使用局部梯度下降法不斷靠近損失函數的最小值	105
8.3.1  局部梯度下降法的原理和TensorFlow的優化器	105
8.3.2  自動微分法的原理及自定義梯度	110
8.3.3  使用自動微分法和局部梯度下降法訓練波士頓房產數據模型	115
第9章  神經網絡的編程範式和靜態圖轉化機制	122
9.1  計算圖和編程範式	122
9.2  靜態圖轉化機制AutoGraph和裝飾器@tf.function	126
9.3  TensorFlow神經網絡模型的類繼承關系	131
9.3.1  TensorFlow的低階API和Keras的高階API	131
9.3.2  Keras的基礎模型類和基礎層類	132
9.4  使用Keras的高階API構建模型並進行可視化	136
9.4.1  使用序列方式構建模型	138
9.4.2  使用函數方式構建模型	139
9.4.3  使用繼承子類方式構建模型	140
9.4.4  提取模型對應的類名稱	143
第4篇  神經網絡層的算法原理和訓練過程控制	144
第10章  神經網絡層的原理和資源開銷	145
10.1  全連接層的原理和資源開銷	145
10.1.1  全連接層的原理	145
10.1.2  全連接層的資源開銷	145
10.1.3  TensorFlow全連接層的API	147
10.2  激活函數的原理和代碼實現	148
10.2.1  激活函數的原理	148
10.2.2  激活函數的代碼實現	149
10.3  二維捲積的原理和資源開銷	150
10.3.1  二維捲積的原理	150
10.3.2  二維捲積的資源開銷	154
10.3.3  TensorFlow二維捲積層的API	155
10.3.4  二維捲積層的配置方式	157
10.4  池化層的原理和實戰	158
10.5  二維捲積層和池化層的感受野	161
10.6  隨機失活算法和默認推理狀態	162
10.7  批次歸一化算法	163
10.7.1  內部協變量漂移和輸入數據重分佈	164
10.7.2  訓練階段的BN算法	170
10.7.3  推理階段的BN算法	173
10.7.4  在神經網絡模型內使用BN層	175
10.8  製作神經網絡的資源開銷函數	177
10.8.1  整體框架	177
10.8.2  二維捲積層的資源開銷算法	178
10.8.3  全連接層的資源開銷算法	179
10.8.4  BN層的資源開銷算法	180
10.8.5  其他成員函數	180
第11章  使用計算加速硬件加快神經網絡的訓練	183
11.1  人工智能的數據類型和運算能力	183
11.2  人工智能計算中的數據類型匹配	185
11.3  人工智能硬件的運算能力評估	187
11.4  安裝GPU版本的TensorFlow計算框架	192
11.5  使用捲積層和全連接層構建經典神經網絡LeNet	196
11.5.1  MNIST手寫數字數據集	197
11.5.2  使用貫序方式建立極簡神經網絡LeNet	200
11.5.3  使用fit方法在MNIST手寫數字數據集上訓練LeNet5	205
11.5.4  使用eager方法在MNIST手寫數字數據集上訓練LeNet5	208
第12章  自定義fit方法和回調機制	214
12.1  fit方法的執行機制和自定義fit方法	214
12.2  fit方法的回調機制和自定義回調函數	217
12.3  TensorFlow的高階回調函數	222
12.3.1  早期停止回調函數與過擬合	222
12.3.2  檢查點保存回調函數	224
12.3.3  檢查點管理器和快速自定義回調函數	225
12.3.4  其他高階回調函數類	228
12.4  訓練過程監控和回調函數	229
12.4.1  TensorBoard和日誌文件的原理和接口	230
12.4.2  TensorBoard的可視化查看	232
12.4.3  eager方法下使用tf.summary存儲日誌	235
12.4.4  fit方法下的TensorBoard日誌存儲回調函數	238
第5篇  目標檢測中的骨乾網絡	244
第13章  經典骨乾網絡AlexNet的原理解析	245
13.1  整體結構和數據增強	245
13.2  負責特徵提取的第一、二層捲積層	246
13.3  負責特徵提取的第三、四、五層捲積層	248
13.4  負責特徵線性組合的第六、七、八層	251
13.5  使用繼承子類方式建立的AlexNet神經網絡	252
13.6  AlexNet的資源開銷	256
第14章  經典小核捲積神經網絡VGG的原理解析	259
14.1  VGG的宏觀結構和微觀特點	259
14.2  VGG16的第一、二個捲積塊結構	261
14.3  VGG16的第三、四、五個捲積塊結構	264
14.4  VGG五個捲積塊的代碼實現	267
14.5  VGG小核捲積技巧下的資源開銷	269
14.6  VGG預訓練模型的加載和下遊網絡	272
第15章  經典殘差神經網絡ResNet的原理解析	276
15.1  殘差連接的原理和結構	277
15.2  瓶頸殘差模塊堆疊的輸入和輸出函數關系	279
15.3  瓶頸殘差模塊的輸入和輸出函數關系	283
15.4  堆疊函數關系和通用的ResNet網絡結構	289
15.5  ResNet50 V2模型的案例解析	293
15.6  ResNet的資源開銷評估	297
15.7  ResNet的遷移學習和權重參數加載	299
第16章  多尺度特徵提取的神經網絡DarkNet	302
16.1  DarkNet的基本處理單元	302
16.1.1  DarkNet的專用捲積塊DarknetConv	303
16.1.2  DarkNet的殘差模塊DarknetResidual	305
16.2  YOLO V3的骨乾網絡DarkNet53	307
16.2.1  YOLO V3的殘差模塊堆疊	307
16.2.2  DarkNet53的整體結構和代碼實現	313
16.2.3  DarkNet53的資源開銷	315
16.3  YOLO V3簡版模型的骨乾網絡DarkNet53-tiny	316
16.3.1  DarkNet53-tiny的整體結構和代碼	316
16.3.2  DarkNet53-tiny的測試和資源開銷	318
16.4  YOLO V4的骨乾網絡CSP-DarkNet	319
16.4.1  殘差模塊堆疊結構	319
16.4.2  五個殘差模塊堆疊結構的代碼實現	321
16.4.3  空間金字塔池化結構	325
16.4.4  CSP-DarkNet的整體結構和代碼實現	328
16.4.5  CSP-DarkNet的測試和資源開銷	330
16.5  YOLO V4簡版模型的骨乾網絡CSP-DarkNet-tiny	331
16.5.1  矩陣切片自定義層的算法和保存規範	331
16.5.2  簡版殘差模塊和簡版殘差模塊堆疊	332
16.5.3  CSP-DarkNet-tiny的整體結構和代碼	336
16.5.4  CSP-DarkNet-tiny的測試和資源開銷	337
第17章  骨乾網絡預訓練和大型圖像數據集ImageNet	339
17.1  ImageNet數據集和ILSVRC競賽	339
17.1.1  單標簽圖像分類任務	340
17.1.2  單標簽分類和定位任務	342
17.1.3  細顆粒度分類任務	345
17.1.4  目標檢測任務	346
17.1.5  其他競賽任務	346
17.2  CIFAR數據集	347
17.3  加載骨乾網絡預訓練權重進行遷移學習	351
17.3.1  快速創建LeNet和AlexNet並進行開銷分析	352
17.3.2  使用高階API快速構建VGG、ResNet、MobileNet	354
17.4  加載骨乾網絡DarkNet的預訓練權重	361
17.4.1  讀取和解析YOLO的官方權重	361
17.4.2  設計DarkNet骨乾網絡並加載轉換後的權重	366
17.5  使用圖像分類任務測試骨乾網絡權重的性能	368
第6篇  三維電腦視覺入門和實戰	371
第18章  三維電腦視覺的數據表達和主要任務	372
18.1  三維電腦視覺的數據表達	372
18.2  三維電腦視覺數據集	374
18.3  三維電腦視覺的主要任務	376
18.4  三維感知任務實戰	381
第19章  圖捲積神經網絡入門和實戰	389
19.1  圖計算的基本概念	389
19.2  圖捲積神經網絡	391
19.3  圖捲積神經網絡實戰	395
附錄A  官方代碼引用說明	403
附錄B  運行環境搭建說明	404
附錄C  TensorFlow的基本矩陣操作	406
參考文獻	407

 
 
     
     
    
 
     
     
     
    