電腦視覺之PyTorch數字圖像處理

侯偉

  • 出版商: 清華大學
  • 出版日期: 2024-09-01
  • 定價: $479
  • 售價: 8.5$407
  • 語言: 簡體中文
  • ISBN: 7302671982
  • ISBN-13: 9787302671985
  • 相關分類: DeepLearningComputer Vision
  • 下單後立即進貨 (約4週~6週)

  • 電腦視覺之PyTorch數字圖像處理-preview-1
  • 電腦視覺之PyTorch數字圖像處理-preview-2
  • 電腦視覺之PyTorch數字圖像處理-preview-3
電腦視覺之PyTorch數字圖像處理-preview-1

相關主題

商品描述

"《電腦視覺之PyTorch數字圖像處理》以數字圖像處理為主題,在詳細介紹數字圖像處理主流算法的基礎上,配合豐富的實戰案例,用PyTorch深度學習框架對相關算法進行應用實踐。本書一方面從張量的維度對經典數字圖像處理算法進行詳細的介紹,另一方面從深度學習的維度對圖像分類、圖像分割和圖像檢測進行細致的講解,從而幫助讀者較為系統地掌握數字圖像處理的相關理論知識和實際應用。 《電腦視覺之PyTorch數字圖像處理》分為3篇,共11章。第1篇圖像處理基礎知識,包括電腦視覺與數字圖像概述、搭建開發環境和Python編程基礎;第2篇基於經典方法的圖像處理,包括圖像處理基礎知識、圖像的基礎特徵、自動梯度與神經網絡、數據準備與圖像預處理;第3篇基於深度學習的圖像處理,包括圖像分類、圖像分割、目標檢測和模型部署。 《電腦視覺之PyTorch數字圖像處理》內容豐富,講解由淺入深、案例豐富、實用性強,特別適合數字圖像處理的入門與進階人員閱讀,也適合數字圖像處理的從業人員與研究人員閱讀,還可作為高等院校數字圖像處理相關課程的教材。"

目錄大綱

第1篇  圖像處理基礎知識

第1章  電腦視覺與數字圖像概述 2

1.1  電腦視覺簡介 3

1.1.1  人類視覺簡介 3

1.1.2  電腦視覺簡介 5

1.2  數字圖像簡介 7

1.2.1  圖像的概念 7

1.2.2  數字圖像的概念 9

1.2.3  數字圖像的類型 10

1.3  數字圖像的存儲 12

1.4  數字圖像的處理 14

1.4.1  數字圖像處理簡介 15

1.4.2  數字圖像處理的發展 15

1.4.3  數字圖像處理的內容 16

1.5  PyTorch框架與圖像處理 16

1.6  小結 18

1.7  習題 18

第2章  搭建開發環境 19

2.1  Python簡介 19

2.1.1  Python的發展歷程 19

2.1.2  下載Python安裝包 20

2.1.3  安裝Python 21

2.1.4  執行Python程序 23

2.2  CUDA簡介 24

2.2.1  CUDA的發展歷程 24

2.2.2  安裝CUDA 24

2.3  Python第三方庫簡介 25

2.3.1  檢索Python第三方庫 25

2.3.2  安裝Python第三方庫 27

2.3.3  與圖像處理相關的第三方庫 28

2.4  安裝PyTorch 29

2.5  安裝可視化工具Visdom 30

2.6  安裝集成開發環境Spyder 31

2.7  小結 32

2.8  習題 32

第3章  Python編程基礎 33

3.1  Python語法基礎知識 33

3.1.1  數據類型與類 33

3.1.2  流程控制 38

3.1.3  函數 39

3.1.4  類與對象 40

3.1.5  標準庫 41

3.1.6  第三方庫 43

3.2  PyTorch基礎知識 46

3.2.1  張量的創建 46

3.2.2  張量的運算 52

3.2.3  捲積及局部鄰域的運算 56

3.2.4  張量的變換 60

3.3  Visdom基礎知識 64

3.3.1  圖像的繪制 65

3.3.2  圖表的繪制 67

3.4  小結 72

3.5  習題 72

第2篇  基於經典方法的圖像處理

第4章  圖像處理基礎知識 74

4.1  圖像與張量的互操作 74

4.2  圖像的點運算 76

4.2.1  圖像增強 77

4.2.2  圖像顏色空間變換 80

4.2.3  灰度圖像的亮度變換 84

4.2.4  簡單圖像二值化 86

4.2.5  圖像蒙版處理 88

4.2.6  圖像的混合 90

4.3  圖像的鄰域運算 92

4.3.1  圖像鄰域的生成 92

4.3.2  圖像的濾波去噪 95

4.3.3  圖像的形態學運算 97

4.3.4  局部二值模式 102

4.3.5  局部最大值指數 104

4.4  圖像的全局運算 106

4.4.1  圖像的簡單旋轉與翻轉 106

4.4.2  圖像的縮放 108

4.4.3  圖像的裁切 108

4.4.4  圖像直方圖均衡化 110

4.5  小結 112

4.6  習題 112

第5章  圖像的基礎特徵 113

5.1  圖像的特徵點 113

5.1.1  特徵點簡介 113

5.1.2  Harris角點 115

5.1.3  提取Harris角點 117

5.2  圖像的線特徵 120

5.2.1  Roberts算子 121

5.2.2  Prewitt算子 122

5.2.3  Sobel算子 124

5.2.4  Scharr算子 125

5.2.5  Laplacian算子 127

5.3  圖像的面特徵 129

5.3.1  K-均值聚類 129

5.3.2  SLIC算法 132

5.4  小結 134

5.5  習題 135

第6章  自動梯度與神經網絡 136

6.1  自動梯度 136

6.1.1  梯度下降與函數極小值求解 136

6.1.2  自動梯度計算 137

6.1.3  自動梯度擬合多項式函數 139

6.2  模塊 141

6.3  激活函數 145

6.4  損失函數 147

6.5  優化器 148

6.6  全連接神經網絡 150

6.7  小結 154

6.8  習題 155

第7章  數據準備與圖像預處理 156

7.1  Torchvision庫簡介 156

7.2  構建數據集 159

7.3  數據變換與增強 164

7.3.1  PIL圖像和張量的共同變換 165

7.3.2  基於張量的變換 170

7.3.3  自定義數據的變換和增強 171

7.4  小結 174

7.5  習題 174

第3篇  基於深度學習的圖像處理

第8章  圖像分類 176

8.1  圖像分類與捲積神經網絡 176

8.1.1  圖像分類及其進展 176

8.1.2  預訓練模型的使用 178

8.2  經典的捲積神經網絡 183

8.2.1  VGGNet模型 183

8.2.2  ResNet模型 187

8.3  捲積神經網絡的訓練與評估 190

8.4  遷移學習簡介 194

8.5  小結 198

8.6  習題 198

第9章  圖像分割 199

9.1  圖像分割與捲積神經網絡 199

9.2  分割數據集 201

9.3  FCN分割模型 206

9.4  UNet分割模型 209

9.5  分割網絡的訓練與評估 212

9.5.1  損失函數 212

9.5.2  優化器 213

9.5.3  評價指標 215

9.6  分割網絡實踐 217

9.7  小結 222

9.8  習題 222

第10章  目標檢測 223

10.1  目標檢測與捲積神經網絡 223

10.1.1  目標檢測的常用術語 224

10.1.2  目標檢測的類型 225

10.2  預訓練網絡的使用 227

10.2.1  Torchvision的預訓練模型 227

10.2.2  YOLOv5的預訓練模型 232

10.3  FCOS模型及其訓練 235

10.3.1  FCOS模型簡介 235

10.3.2  數據集的構建 237

10.3.3  模型的訓練和預測 239

10.4  YOLOv5模型及其訓練 241

10.4.1  數據集的構建 242

10.4.2  模型的構建 243

10.4.3  模型的訓練和預測 244

10.5  小結 246

10.6  習題 246

第11章  模型部署 247

11.1  模型部署簡介 247

11.2  使用LibTorch進行模型部署 249

11.3  使用ONNX進行模型部署 252

11.4  使用OpenCV進行模型部署 253

11.5  使用OpenVINO進行模型部署 254

11.6  小結 255

11.7  習題 256