計算機視覺 — 基於 Python、Keras 和 TensorFlow 的深度學習方法 Computer Vision Using Deep Learning: Neural Network Architectures with Python and Keras

Vaibhav Verdhan 陳朗 汪雄飛 汪榮貴 譯

  • 計算機視覺 — 基於 Python、Keras 和 TensorFlow 的深度學習方法-preview-1
  • 計算機視覺 — 基於 Python、Keras 和 TensorFlow 的深度學習方法-preview-2
  • 計算機視覺 — 基於 Python、Keras 和 TensorFlow 的深度學習方法-preview-3
計算機視覺 — 基於 Python、Keras 和 TensorFlow 的深度學習方法-preview-1

買這商品的人也買了...

商品描述

本書聚焦深度學習架構和技術,使用Keras和TensorFlow庫創建解決方案。涉及多種神經網絡架構,包括LeNet、AlexNet、VGG、Inception、R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN、YOLO和SqueezeNet,並通過實踐瞭解如何基於Python實現深度學習架構。書中對所有代碼片段進行詳細分解並徹底分析,以便可以在各自的環境中實現相同的原則。

目錄大綱

 

目錄

 

第1章電腦視覺和深度學習簡介

 

1.1使用OpenCV處理圖像

 

1.1.1使用OpenCV檢測顏色

 

1.1.2使用OpenCV檢測形狀

 

1.1.3使用OpenCV檢測人臉

 

1.2深度學習的基礎知識

 

1.2.1神經網絡背後的動力

 

1.2.2神經網絡中的層

 

1.2.3神經元

 

1.2.4超參數

 

1.2.5ANN的連接與權重

 

1.2.6偏置項

 

1.2.7激活函數

 

1.2.8學習率

 

1.2.9反向傳播

 

1.2.10過度擬合

 

1.2.11梯度下降算法

 

1.2.12損失函數

 

1.3深度學習的工作原理

 

1.3.1深度學習過程

 

1.3.2流行的深度學習程序庫

 

1.4小結

 

習題

 

拓展閱讀

 

第2章面向電腦視覺的深度學習

 

2.1使用TensorFlow和Keras進行深度學習

 

2.2張量

 

2.3捲積神經網絡

 

2.3.1捲積

 

2.3.2池化層

 

2.3.3全連接層

 

2.4開發基於CNN的深度學習解決方案

 

2.5小結

 

習題

 

拓展閱讀

 

 

 

 

 

 

 

 

第3章使用LeNet進行圖像分類

 

3.1深度學習的網絡架構

 

3.2LeNet架構

 

3.2.1LeNet1架構

 

3.2.2LeNet4架構

 

3.2.3LeNet5架構

 

3.2.4增強LeNet4架構

 

3.3使用LeNet創建圖像分類模型

 

3.3.1使用LeNet進行MNIST分類

 

3.3.2使用LeNet進行德國交通標志分類

 

3.4小結

 

習題

 

拓展閱讀

 

第4章VGG和AlexNet網絡

 

4.1AlexNet和VGG神經網絡模型

 

4.1.1AlexNet模型架構

 

4.1.2VGG模型架構

 

4.2使用AlexNet和VGG開發應用案例

 

4.2.1CIFAR數據集

 

4.2.2使用AlexNet模型處理CIFAR10數據集

 

4.2.3使用VGG模型處理CIFAR10數據集

 

4.3AlexNet模型和VGG模型的比較

 

4.4使用CIFAR100數據集

 

4.5小結

 

習題

 

拓展閱讀

 

第5章使用深度學習進行目標檢測

 

5.1目標檢測

 

5.1.1目標分類、目標定位與目標檢測

 

5.1.2目標檢測的應用案例

 

5.2目標檢測方法

 

5.3目標檢測的深度學習框架

 

5.3.1目標檢測的滑窗法

 

5.3.2邊界框方法

 

5.3.3重疊度指標

 

5.3.4非極大性抑制

 

5.3.5錨盒

 

5.4深度學習網絡架構

 

5.4.1基於區域的 CNN

 

5.4.2Fast RCNN

 

5.4.3Faster RCNN

 

5.4.4YOLO算法

 

5.4.5單階段多框檢測器

 

5.5遷移學習

 

5.6實時的目標檢測Python實現

 

5.7小結

 

習題

 

拓展閱讀

 

第6章人臉識別與手勢識別

 

6.1人臉識別

 

6.1.1人臉識別的應用

 

6.1.2人臉識別的過程

 

6.2人臉識別的深度學習模式

 

6.2.1Facebook的DeepFace解決方案

 

6.2.2FaceNet的人臉識別

 

6.3FaceNet的Python實現

 

6.4手勢識別Python解決方案

 

6.5小結

 

習題

 

拓展閱讀

 

第7章基於深度學習的視頻分析

 

7.1視頻處理

 

7.2視頻分析的應用

 

7.3梯度消失和梯度爆炸

 

7.3.1梯度消失

 

7.3.2梯度爆炸

 

7.4ResNet架構

 

7.5Inception網絡

 

7.5.11×1捲積

 

7.5.2GoogLeNet架構

 

7.5.3Inception v2中的改進

 

7.5.4Inception v3模型

 

7.6視頻分析

 

7.7使用Inception v3和ResNet創建Python解決方案

 

7.8小結

 

習題

 

拓展閱讀

 

第8章端到端的網絡模型開發

 

8.1深度學習項目需求

 

8.2深度學習項目的開發過程

 

8.2.1業務問題的定義

 

8.2.2源數據或數據收集階段

 

8.2.3數據存儲與管理

 

8.2.4數據準備和擴充

 

8.2.5圖像樣本增強

 

8.3深度學習的建模過程

 

8.3.1遷移學習

 

8.3.2常見錯誤/挑戰和模型性能提高

 

8.3.3模型的部署與維護

 

8.4小結

 

習題

 

拓展閱讀

 

附錄A

 

A1CNN中的主要激活函數與網絡層

 

A2Google Colab