電腦視覺之 PyTorch 數字圖像處理

侯偉

預覽內頁

出版商: 清華大學
出版日期: 2024-09-01
定價: $479
售價: 8.5 折 $407
語言: 簡體中文
頁數: 268
ISBN: 7302671982
ISBN-13: 9787302671985
相關分類: Computer Vision

立即出貨

買這商品的人也買了...

~~$450~~ $382

數學女孩─隨機演算法
~~$880~~ $748

超圖解 ESP32 深度實作
~~$594~~ $564

AI 嵌入式系統：算法優化與實現
~~$500~~ $199

給工程師的第一本理財書：程式金融交易的 118個入門關鍵技巧【暢銷回饋版】
$346

四旋翼無人機自主控制技術
~~$594~~ $564

深入理解 Transformer 自然語言處理
~~$828~~ $786

智能無人集群 — 改變未來戰爭的顛覆性力量
~~$820~~ $697

超圖解 ESP32 應用實作
~~$354~~ $336

多旋翼無人機嵌入式飛控開發實戰
~~$479~~ $455

計算機視覺實戰－語意分割與目標偵測
$663

多旋翼無人機控制一體化技術
~~$780~~ $616

Tensorflow 接班王者：Google JAX 深度學習又快又強大 (好評回饋版)
$308

Arduino電子系統設計實踐(基於Arduino IDE與MATLAB協同開發的方法)
~~$720~~ $568

Clean Code：Python 寫乾淨程式碼 - 告別技術債，不再為爛程式加班收爛攤
~~$640~~ $505

C 程式設計－教學與自習最佳範本
~~$650~~ $455

AI 程式設計、深度學習與 LLM 入門到精通：PyTorch × GPT × Transformer × LLaMA 實作指南（iThome鐵人賽系列書）
~~$780~~ $616

不靠框架硬功夫 - Scikit-learn 手刻機器學習每行程式碼 (好評熱銷版)
~~$880~~ $695

實用 DeepSeek 技術 - 開發真正可用的 LLM 應用程式
~~$880~~ $695

訂製自己的 Linux - Yocto 專案成為高效嵌入式大師
~~$499~~ $424

最強 AI 組合技！NotebookLM / Gemini / Nano Banana / Veo 3 【影音生成進化版】
~~$620~~ $465

ChatGPT × Google Apps Script 雲端自動化實戰：從構想到上線，跟重複的例行工作說再見！
~~$980~~ $774

比 RAG 更強 - 知識增強 LLM 型應用程式實戰
~~$980~~ $774

LLM 開源大物 - DeepSeek 深入技術多模態開發
~~$820~~ $647

用 LangChain 打造生成式 AI 創新應用：從 LangGraph 到 LangSmith
~~$620~~ $490

Gemini x NotebookLM 領軍：Nano Banana x Imagen x Veo x Gem x Gemini Live - Google 多模態 AI 工作流

商品描述

"《電腦視覺之PyTorch數字圖像處理》以數字圖像處理為主題，在詳細介紹數字圖像處理主流算法的基礎上，配合豐富的實戰案例，用PyTorch深度學習框架對相關算法進行應用實踐。本書一方面從張量的維度對經典數字圖像處理算法進行詳細的介紹，另一方面從深度學習的維度對圖像分類、圖像分割和圖像檢測進行細致的講解，從而幫助讀者較為系統地掌握數字圖像處理的相關理論知識和實際應用。《電腦視覺之PyTorch數字圖像處理》分為3篇，共11章。第1篇圖像處理基礎知識，包括電腦視覺與數字圖像概述、搭建開發環境和Python編程基礎；第2篇基於經典方法的圖像處理，包括圖像處理基礎知識、圖像的基礎特徵、自動梯度與神經網絡、數據準備與圖像預處理；第3篇基於深度學習的圖像處理，包括圖像分類、圖像分割、目標檢測和模型部署。《電腦視覺之PyTorch數字圖像處理》內容豐富，講解由淺入深、案例豐富、實用性強，特別適合數字圖像處理的入門與進階人員閱讀，也適合數字圖像處理的從業人員與研究人員閱讀，還可作為高等院校數字圖像處理相關課程的教材。"

作者簡介

侯偉，華北理工大學理學院教師，工學博士，教授圖像處理和深度學習等相關課程。從事數字圖像處理及其在工業自動視覺檢測方面的研究和應用工作，具備紮實的理論基礎和豐富的編程經驗，對數字圖像處理和深度學習具有較為深刻的認識和理解。目前已發表學術論文5篇，獲授權發明專利2項，授權軟件著作權1項，參編教材1部。

目錄大綱

第1篇圖像處理基礎知識

第1章電腦視覺與數字圖像概述 2

1.1 電腦視覺簡介 3

1.1.1 人類視覺簡介 3

1.1.2 電腦視覺簡介 5

1.2 數字圖像簡介 7

1.2.1 圖像的概念 7

1.2.2 數字圖像的概念 9

1.2.3 數字圖像的類型 10

1.3 數字圖像的存儲 12

1.4 數字圖像的處理 14

1.4.1 數字圖像處理簡介 15

1.4.2 數字圖像處理的發展 15

1.4.3 數字圖像處理的內容 16

1.5 PyTorch框架與圖像處理 16

1.6 小結 18

1.7 習題 18

第2章搭建開發環境 19

2.1 Python簡介 19

2.1.1 Python的發展歷程 19

2.1.2 下載Python安裝包 20

2.1.3 安裝Python 21

2.1.4 執行Python程序 23

2.2 CUDA簡介 24

2.2.1 CUDA的發展歷程 24

2.2.2 安裝CUDA 24

2.3 Python第三方庫簡介 25

2.3.1 檢索Python第三方庫 25

2.3.2 安裝Python第三方庫 27

2.3.3 與圖像處理相關的第三方庫 28

2.4 安裝PyTorch 29

2.5 安裝可視化工具Visdom 30

2.6 安裝集成開發環境Spyder 31

2.7 小結 32

2.8 習題 32

第3章 Python編程基礎 33

3.1 Python語法基礎知識 33

3.1.1 數據類型與類 33

3.1.2 流程控制 38

3.1.3 函數 39

3.1.4 類與對象 40

3.1.5 標準庫 41

3.1.6 第三方庫 43

3.2 PyTorch基礎知識 46

3.2.1 張量的創建 46

3.2.2 張量的運算 52

3.2.3 捲積及局部鄰域的運算 56

3.2.4 張量的變換 60

3.3 Visdom基礎知識 64

3.3.1 圖像的繪制 65

3.3.2 圖表的繪制 67

3.4 小結 72

3.5 習題 72

第2篇基於經典方法的圖像處理

第4章圖像處理基礎知識 74

4.1 圖像與張量的互操作 74

4.2 圖像的點運算 76

4.2.1 圖像增強 77

4.2.2 圖像顏色空間變換 80

4.2.3 灰度圖像的亮度變換 84

4.2.4 簡單圖像二值化 86

4.2.5 圖像蒙版處理 88

4.2.6 圖像的混合 90

4.3 圖像的鄰域運算 92

4.3.1 圖像鄰域的生成 92

4.3.2 圖像的濾波去噪 95

4.3.3 圖像的形態學運算 97

4.3.4 局部二值模式 102

4.3.5 局部最大值指數 104

4.4 圖像的全局運算 106

4.4.1 圖像的簡單旋轉與翻轉 106

4.4.2 圖像的縮放 108

4.4.3 圖像的裁切 108

4.4.4 圖像直方圖均衡化 110

4.5 小結 112

4.6 習題 112

第5章圖像的基礎特徵 113

5.1 圖像的特徵點 113

5.1.1 特徵點簡介 113

5.1.2 Harris角點 115

5.1.3 提取Harris角點 117

5.2 圖像的線特徵 120

5.2.1 Roberts算子 121

5.2.2 Prewitt算子 122

5.2.3 Sobel算子 124

5.2.4 Scharr算子 125

5.2.5 Laplacian算子 127

5.3 圖像的面特徵 129

5.3.1 K-均值聚類 129

5.3.2 SLIC算法 132

5.4 小結 134

5.5 習題 135

第6章自動梯度與神經網絡 136

6.1 自動梯度 136

6.1.1 梯度下降與函數極小值求解 136

6.1.2 自動梯度計算 137

6.1.3 自動梯度擬合多項式函數 139

6.2 模塊 141

6.3 激活函數 145

6.4 損失函數 147

6.5 優化器 148

6.6 全連接神經網絡 150

6.7 小結 154

6.8 習題 155

第7章數據準備與圖像預處理 156

7.1 Torchvision庫簡介 156

7.2 構建數據集 159

7.3 數據變換與增強 164

7.3.1 PIL圖像和張量的共同變換 165

7.3.2 基於張量的變換 170

7.3.3 自定義數據的變換和增強 171

7.4 小結 174

7.5 習題 174

第3篇基於深度學習的圖像處理

第8章圖像分類 176

8.1 圖像分類與捲積神經網絡 176

8.1.1 圖像分類及其進展 176

8.1.2 預訓練模型的使用 178

8.2 經典的捲積神經網絡 183

8.2.1 VGGNet模型 183

8.2.2 ResNet模型 187

8.3 捲積神經網絡的訓練與評估 190

8.4 遷移學習簡介 194

8.5 小結 198

8.6 習題 198

第9章圖像分割 199

9.1 圖像分割與捲積神經網絡 199

9.2 分割數據集 201

9.3 FCN分割模型 206

9.4 UNet分割模型 209

9.5 分割網絡的訓練與評估 212

9.5.1 損失函數 212

9.5.2 優化器 213

9.5.3 評價指標 215

9.6 分割網絡實踐 217

9.7 小結 222

9.8 習題 222

第10章目標檢測 223

10.1 目標檢測與捲積神經網絡 223

10.1.1 目標檢測的常用術語 224

10.1.2 目標檢測的類型 225

10.2 預訓練網絡的使用 227

10.2.1 Torchvision的預訓練模型 227

10.2.2 YOLOv5的預訓練模型 232

10.3 FCOS模型及其訓練 235

10.3.1 FCOS模型簡介 235

10.3.2 數據集的構建 237

10.3.3 模型的訓練和預測 239

10.4 YOLOv5模型及其訓練 241

10.4.1 數據集的構建 242

10.4.2 模型的構建 243

10.4.3 模型的訓練和預測 244

10.5 小結 246

10.6 習題 246

第11章模型部署 247

11.1 模型部署簡介 247

11.2 使用LibTorch進行模型部署 249

11.3 使用ONNX進行模型部署 252

11.4 使用OpenCV進行模型部署 253

11.5 使用OpenVINO進行模型部署 254

11.6 小結 255

11.7 習題 256

電腦視覺之 PyTorch 數字圖像處理

侯偉

買這商品的人也買了...

商品描述

作者簡介

目錄大綱

類似商品