計算機視覺之深度學習:使用 TensorFlow 和 Keras 訓練高級神經網絡 Deep Learning for Computer Vision
Rajalingappaa Shanmugamani 白勇譯
- 出版商: 人民郵電
- 出版日期: 2020-01-01
- 定價: $354
- 售價: 7.9 折 $280
- 語言: 簡體中文
- 頁數: 202
- 裝訂: 平裝
- ISBN: 7115531587
- ISBN-13: 9787115531582
-
相關分類:
DeepLearning、TensorFlow、Computer Vision
- 此書翻譯自: Deep Learning for Computer Vision
立即出貨
買這商品的人也買了...
-
$958深度學習
-
$607Python 深度學習 (Deep Learning with Python)
-
$352機器學習:使用 OpenCV 和 Python 進行智能圖像處理 (Machine Learning for OpenCV)
-
$454OpenCV 3 和 Qt5 電腦視覺應用開發 (Computer Vision with OpenCV 3 and Qt5: Build visually appealing, multithreaded, cross-platform computer vision applications)
-
$403深度學習實踐 : 計算機視覺
-
$414$393 -
$300$255 -
$650$514 -
$403OpenCV 4 電腦視覺項目實戰, 2/e
-
$834$792 -
$556電腦視覺與深度學習實戰:以 MATLAB、Python 為工具
-
$454深度學習之 PyTorch 物體檢測實戰
-
$352生成對抗網絡項目實戰 (Generative Adversarial Networks Projects)
-
$580$458 -
$1,000$790 -
$266移動端機器學習實戰
-
$505知識圖譜與深度學習
-
$454深度實踐 OCR:基於深度學習的文字識別
-
$454Python 圖像處理實戰 (Hands-On Image Processing with Python: Expert techniques for advanced image analysis and effective interpretation of image data)
-
$607深度學習之人臉圖像處理:核心算法與案例實戰
-
$658Python無監督機器學習最佳實踐
-
$301Python 自然語言處理實戰 (Hands-On Natural Language Processing with Python: A practical guide to applying deep learning architectures to your NLP applications)
-
$352計算機視覺入門到實踐
-
$203實戰深度學習——原理、框架及應用
-
$331電腦視覺 — 基於 OpenCV 與 TensorFlow 的深度學習方法
相關主題
商品描述
本書開門見山,直接幫助你準備好訓練高效深度學習模型的環境,
以完成各種計算機視覺任務。
書中介紹了常見的深度學習架構,如卷積神經網絡和遞歸神經網絡;
講述瞭如何利用深度學習進行圖像分類、圖像檢索、目標檢測、語義分割等內容。
讀完本書,你將能夠開發和訓練自己的深度學習模型,並用它們解決計算機視覺難題。
作者簡介
Rajalingappaa Shanmugamani
目前在Kairos擔任技術經理。
在此之前,曾在新加坡SAP公司擔任深度學習主管,
也在創業公司從事過計算機視覺產品的開發和諮詢工作。
在同行評審的期刊和會議上多次發表文章,並在機器學習領域申請了專利。
與他人合著出版了Hands-On Natural Language Processing with Python、
Python Reinforcement Learning、Python: Advanced Guide to Artificial Intelligence、
TensorFlow Deep Learning Projects等書。
【譯者介紹】
白勇
海南大學信息科學技術學院教授、博士生導師、美國歸國博士。
長期從事物聯網、人工智能方面的研究。
已承擔*家級和省部級項目10多項,發表學術論文100多篇,
授權中國和美國發明專利10多項。
目錄大綱
目錄:
第1章入門1
1.1理解深度學習1
1.1.1感知機1
1.1.2激活函數2
1.1.3人工神經網絡4
1.1.4訓練神經網絡7
1.1.5嘗試TensorFlow遊樂場8
1.1.6卷積神經網絡8
1.1.7循環神經網絡10
1.1.8長短期記憶網絡11
1.2計算機視覺深度學習12
1.2.1分類12
1.2.2檢測或定位與分割12
1.2.3相似性學習13
1.2.4圖像題註13
1.2.5生成模型14
1.2.6視頻分析15
1.3建立開發環境15
1.3.1硬件和操作系統15
1.3.2安裝軟件包17
1.4小結23
第2章圖像分類24
2.1在TensorFlow中訓練MNIST模型24
2.1.1 MNIST數據集24
2.1.2加載MNIST數據25
2.1.3建立一個感知機25
2.1.4構建多層卷積網絡28
2.2在Keras中訓練MNIST模型35
2.2.1準備數據集35
2.2.2構建模型36
2.3其他流行的圖像測試數據集38
2.3.1 CIFAR數據集38
2.3.2 Fashion-MNIST數據集38
2.3.3 ImageNet數據集和競賽39
2.4更大的深度學習模型40
2.4.1 AlexNet模型40
2.4.2 VGG-16模型41
2.4.3谷歌Inception-V3模型42
2.4.4微軟ResNet-50模型45
2.4.5 SqueezeNet模型45
2.4.6空間變換網絡模型46
2.4.7 DenseNet模型47
2.5訓練貓與狗的模型47
2.5.1準備數據48
2.5.2使用簡單CNN進行基準測試48
2.5.3增強數據集49
2.5.4遷移學習或微調模型50
2.5.5在深度學習中微調一些層51
2.6開發現實世界的應用53
2.6.1選擇正確的模型53
2.6.2處理欠擬合和過擬合場景53
2.6.3從面部檢測性別和年齡54
2.6.4微調服裝模型54
2.6.5 *牌安全54
2.7小結54
第3章圖像檢索55
3.1理解視覺特徵55
3.1.1深度學習模型的可視化激活56
3.1. 2嵌入可視化57
3.1.3 DeepDream 60
3.1.4對抗樣本64
3.2模型推斷65
3.2.1導出模型65
3.2.2提供訓練好的模型66
3.3基於內容的圖像檢索68
3.3.1構建檢索流水線68
3.3. 2有效的檢索71
3.3.3使用自編碼器去噪74
3.4小結77
第4章目標檢測78
4.1檢測圖像中的目標78
4.2探索數據集79
4.2.1 ImageNet數據集79
4.2.2 PASCAL VOC挑戰79
4.2.3 COCO目標檢測挑戰79
4.2.4使用指標評估數據集80
4.3目標定位算法81
4.3.1使用滑動窗口定位目標82
4.3.2將定位看作回歸問題83
4.4檢測目標86
4.4.1 R-CNN(區域卷積神經網絡) 86
4.4.2 Fast R-CNN 86
4.4.3 Faster R-CNN 87
4.4.4 SSD(單射多框探測器) 88
4.5目標檢測API 88
4.5.1安裝和設置88
4.5.2預訓練模型89
4.5.3重新訓練目標檢測模型90
4.5.4為自動駕駛汽車訓練行人檢測92
4.6 YOLO目標檢測算法92
4.7小結94
第5章語義分割95
5.1預測像素95
5.1.1診斷醫學圖像97
5.1.2通過衛星圖像了解地球97
5.1.3提供機器人視覺98
5.2數據集98
5.3語義分割算法98
5.3.1全卷積網絡98
5.3.2 SegNet架構99
5.3.3膨脹卷積103
5.3.4 DeepLab 104
5.3.5 RefiNet 105
5.3.6 PSPnet 106
5.3.7大卷積核的重要性106
5.3.8 DeepLab v3 107
5.4超神經分割107
5.5分割衛星圖像111
5.6分割實例113
5.7小結114
第6章相似性學習115
6.1相似性學習算法115
6.1.1孿生網絡115
6.1.2 FaceNet模型118
6.1.3 DeepNet模型120
6.1.4 DeepRank模型120
6.1.5視覺推薦系統121
6.2人臉分析122
6.2.1人臉檢測122
6.2.2人臉特徵點和屬性123
6.2.3人臉識別126
6.2.4人臉聚類130
6.3小結131
第7章圖像題註132
7.1了解問題和數據集132
7.2理解圖像題註的自然語言處理132
7.2.1用向量形式表達詞133
7.2.2將詞轉換為向量133
7.2.3訓練一個嵌入134
7.3圖像題註和相關問題的方法135
7.3.1使用條件隨機場來鏈接圖像和文本136
7.3.2在CNN特徵上使用RNN生成題註136
7.3.3使用圖像排序創建題註138
7.3.4從圖像檢索題註與從題註檢索圖像139
7.3.5密集題註140
7.3.6使用RNN生成題註141
7.3.7使用多模態度量空間142
7.3.8使用注意網絡生成題註143
7.3.9知道什麼時候查看143
7.4實現基於注意力的圖像題註145
7.5小結147
第8章生成模型148
8.1生成模型的應用148
8.1.1藝術風格遷移148
8.1.2預測視頻中的下一幀149
8.1.3圖像的超分辨率150
8.1.4交互式圖像生成151
8.1.5圖像到圖像的翻譯151
8.1.6文本到圖像的生成152
8.1.7圖像修復153
8.1.8圖像混合153
8.1.9轉換屬性154
8.1.10創建訓練數據154
8.1. 11創建新的動畫角色155
8.1.12照片3D模型155
8.2神經藝術風格遷移156
8.2.1內容損失156
8.2.2使用Gram矩陣的風格損失160
8.2.3風格遷移162
8.3生成對抗網絡165
8.3.1 vanilla GAN 165
8.3.2條件GAN 167
8.3.3對抗損失167
8.3.4圖像翻譯168
8.3.5 InfoGAN 168
8.3.6 GAN的缺點169
8.4視覺對話模型169
8.5小結171
第9章視頻分類172
9.1了解視頻和視頻分類172
9.1.1探索視頻分類數據集172
9.1 .2將視頻分割成幀175
9.1.3視頻分類方法175
9.2將基於圖像的方法擴展到視頻184
9.2.1人體姿態回歸184
9.2.2視頻分割185
9.2.3視頻題註186
9.2.4視頻生成188
9.3小結188
第10章部署189
10.1模型的性能189
10.1.1量化模型189
10.1.2 MobileNets 190
10.2雲部署193
10.2.1 AWS 193
10.2.2 Google雲平台197
10.3在設備中部署模型200
10.3.1 Jetson TX2 200
10.3.2 Android 201
10.3.3 iPhone 201
10.4小結202