PyTorch 自動駕駛視覺感知算法實戰

劉斯坦

出版商: 機械工業
出版日期: 2024-01-01
售價: $714
貴賓價: 9.5 折 $678
語言: 簡體中文
頁數: 264
裝訂: 平裝
ISBN: 7111740270
ISBN-13: 9787111740278
相關分類: DeepLearning、自駕車

立即出貨

買這商品的人也買了...

~~$690~~ $545

從來沒有這麼明白過：TensorFlow 上車就學會 (書況有些許瑕疵凹痕,不介意再下單)
$948

智能網聯汽車 V2X 與智能網聯設施 I2X
~~$528~~ $502

智能網聯汽車先進駕駛輔助系統 (ADAS)
~~$790~~ $624

Python 資料視覺化從 2D 到 3D 使用 matplotlib 實作 - 王者歸來 (全彩印刷)
~~$880~~ $695

一本書秒殺電腦視覺最新應用：80個 Python 大師級實例, 2/e
$616

自動駕駛：感知原理與實踐
~~$894~~ $849

自動駕駛汽車視覺和行為實踐用 Python3 和 OpenCV4 探索視覺感知、車道檢測和物體分類
$760

PyTorch 電腦視覺實戰：目標偵測、影像處理與深度學習
~~$980~~ $774

AI + IoT 佈建邊緣運算 - 電腦視覺業界專案原理及實作
~~$720~~ $569

Hugging Face 模型及資料大公開 - 利用 BERT 建立全中文 NLP 應用
$556

大規模語言模型：從理論到實踐
~~$1,280~~ $1,011

萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰
~~$760~~ $532

TensorFlow 模型解析與範例大全
$445

LangChain 入門指南：構建高可復用、可擴展的 LLM 應用程序
~~$880~~ $660

跟 NVIDIA 學深度學習！從基本神經網路到 ......、GPT、BERT...，紮穩機器視覺與大型語言模型 (LLM) 的建模基礎
~~$880~~ $695

邊緣AI｜使用嵌入式機器學習解決真實世界的問題 (AI at the Edge: Solving Real-World Problems with Embedded Machine Learning)
$450

Llama 大模型實踐指南
~~$539~~ $512

深度學習的數學——使用Python語言
~~$660~~ $515

Python：股票 × ETF 量化交易實戰 105個活用技巧, 2/e
~~$594~~ $564

人工智能邊緣運算開發實戰：基於 NVIDIA Jetson Nano
~~$1,200~~ $948

深度學習 -- 最佳入門邁向 AI 專題實戰, 2/e
$505

基於深度學習的圖像處理與實踐
~~$474~~ $450

PyTorch 深度學習與電腦視覺實踐
~~$774~~ $735

Python 數據可視化：科技圖表繪制
~~$690~~ $545

輕量又漂亮的 Python Web 框架 - Streamlit AI 時代非學不可

商品描述

本書全面介紹了自動駕駛系統中深度學習視覺感知的相關知識，包括深度神經網絡和深度捲積神經網絡的基本理論，
深入講解了自動駕駛中常用的目標檢測、語義、實例分割和單目深度估計四種視覺感知任務。
本書對自動駕駛工程實踐中很重要但經常被忽略的知識進行了全面總結，包括多任務模型的損失平衡、
Ubuntu操作系統、Anaconda和Docker等環境配置工具、C++開發環境搭建、
神經網絡壓縮、模型導出和量化、TensorRT推理引擎等和部署相關的技術。
本書各個任務都由PyTorch實現，模型部署的代碼則提供C++實現，並附帶一個中等規模的自動駕駛數據集用於示例。
所有代碼都公開在Github公開源碼倉庫上，很多代碼可以直接用於生產環境，且提供了商業友好的代碼許可證。

作者簡介

劉斯坦，本科畢業於上海交通大學，碩士畢業於德國慕尼黑工業大學。深度學習資深工程師，從事無人駕駛智慧感知系統的研發工作。相關領域從業超過十年，負責無人駕駛系統中多個神經網絡模型在量產車的落地。對深度學習的各個領域不但有著全景式的理解，也具備從數學理論到部署產品線的知識縱深。

目錄大綱

前言
第1章捲積神經網絡的理論基礎
1.1神經網絡回顧
1.1.1神經網絡模型
1.1.2神經網絡的訓練——反向傳播算法
1.1.3神經網絡的擬合能力和泛化能力
1.2什麼是捲積神經網絡
1.2.1什麼是捲積運算
1.2.2通道（Channel）和三維捲積
1.2.3為什麼需要深度網絡
1.2.4什麼是批次（Batch）
1.3捲積神經網絡的組成細節
1.3.1捲積神經網絡的輸入層
1.3.2神經網絡的輸出層
1.3.3捲積層和轉置捲積層
1.3.4激活層
1.3.5歸一化層
1.3.6上採樣層和下採樣層
1.3.7池化層
1.3.8跳躍、空間註意力等特殊的連接方式
1.3.9構建一個復雜的捲積神經網絡
1.4捲積神經網絡的訓練
1.4.1常用損失函數
1.4.2常用的正則化方法
1.4.3常用的優化器
1.4.4常用的訓練學習率調整方法
第2章深度學習開發環境及常用工具庫
2.1硬件和操作系統
2.1.1顯卡
2.1.2操作系統
2.2Python開發環境管理
2.2.1Anaconda虛擬環境的管理
2.2.2Python的包管理器pip
2.3常用的Python包
2.3.1NumPy——Python科學計算庫
2.3.2OpenCV——Python圖像處理庫
2.4GPU加速的深度學習和科學計算庫PyTorch
2.4.1GPU加速的科學計算功能
2.4.2PyTorch的自動求導功能
2.4.3PyTorch的優化器
2.4.4PyTorch的數據加載
2.4.5用PyTorch搭建神經網絡
2.4.6常用的輔助工具
2.4.7搭建一個神經網絡並進行訓練
第3章神經網絡的特徵編碼器——主乾網絡
3.1什麼是神經網絡的主乾網絡
3.1.1神經網絡的元結構
3.1.2神經網絡的主乾網絡及有監督預訓練
3.1.3主乾網絡的自監督預訓練
3.2流行的主乾網絡
3.2.1簡單直白的主乾網絡——類VGG網絡
3.2.2最流行的主乾網絡——ResNet系列網絡
3.2.3速度更快的輕量級主乾網絡——MobileNet系列
3.2.4自由縮放的主乾網絡——RegNet系列
3.3使用TorchVision模型庫提供的主乾網絡
3.3.1構建和加載模型
3.3.2修改主乾網絡獲取多尺度特徵圖
3.3.3不同主乾網絡和預訓練模型的訓練對比
第4章目標檢測網絡——識別車輛
4.1目標檢測基本概念
4.1.1Anchor
4.1.2NMS
4.1.3目標檢測網絡的類別
4.2以Faster RCNN為代表的兩階段檢測方法
4.2.1RPN網絡
4.2.2ROI網絡
4.2.3使用TorchVision模型庫中的Faster RCNN
4.3以Yolo為代表的一階段檢測方法
4.3.1YoloV3的整體結構
4.3.2Yolo的訓練
4.3.3類Yolo的一階段檢測網絡
4.4以CenterNet為代表的Anchor-Free方法
4.4.1CenterNet的整體結構
4.4.2用高斯模糊和Focal Loss訓練CenterNet
4.4.3YoloX網絡
4.5Yolo的PyTorch實現
4.5.1樣本選擇算法的實現
4.5.2Yolo層的實現
4.5.3構造損失函數
4.5.4NMS的實現
第5章語義分割與實例分割——逐像素分類
5.1語義分割
5.1.1語義分割的網絡構架和損失函數
5.1.2評價語義分割質量的指標
5.1.3使用OHEM和類別權重解決樣本不均衡問題
5.1.4語義分割的關鍵——信息融合
5.2使用PyTorch訓練一個語義分割模型
5.2.1語義分割的數據加載
5.2.2加載Lite R-ASPP語義分割模型進行訓練
5.2.3計算混淆矩陣
5.2.4計算mIoU
5.3實例分割——分辨行人和車輛
5.3.1以Mask-RCNN為代表的兩階段實例分割方法
5.3.2以SOLO為代表的單階段實例分割方法
5.3.3基於CondInst的半監督實例分割方法BoxInst
5.4安裝及使用OpenMMLab——以MMDetection為例
5.4.1安裝和配置MMDetection
5.4.2MMDetection介紹
5.4.3SOLO代碼解析
第6章單目深度估計——重建三維世界
6.1電腦三維視覺基礎知識
6.1.1相機模型
6.1.2什麼是深度圖
6.1.3相機運動模型
6.2單目深度估計的網絡構架
6.2.1深度圖預測網絡
6.2.2基於相對視差的深度圖輸出編碼
6.2.3基於有序回歸的深度圖輸出編碼
6.2.4相機運動估計網絡
6.3無監督學習的機制
6.3.1無監督學習系統構架
6.3.2將深度圖反投影為點雲的PyTorch實現
6.3.3從相鄰幀採集RGB值並重投影的PyTorch實現
6.3.4無監督單目深度推斷的損失函數
6.4可能存在的問題及解決方案
6.4.1用圖像梯度圖解決邊緣模糊問題
6.4.2用圖像一致性掩膜解決移動物體問題
6.4.3用速度損失解決尺度問題
第7章通過控制網絡結構提高速度和精度
7.1使用多任務網絡構架提高速度和精度
7.1.1多任務網絡的設計
7.1.2多任務網絡的任務平衡問題
7.2用PyTorch搭建一個語義分割和目標檢測雙任務網絡
7.2.1多任務數據加載
7.2.2多任務網絡的搭建
7.2.3多任務損失的平衡
7.3壓縮神經網絡提高推理速度
7.3.1什麼是神經網絡壓縮
7.3.2幾種常見的通道剪枝方法
7.3.3在訓練中使用L1正則化壓縮權重
7.3.4使用可微通道加權進行通道剪枝
7.3.5網絡壓縮的流程
7.4用PyTorch實現可微網絡壓縮
7.4.1用PyTorch構造可微通道選擇層
7.4.2利用通道選擇層確定壓縮方案
7.4.3對PyTorch模型進行壓縮並對比運行速度
第8章導出和部署神經網絡模型
8.1配置開發環境
8.1.1Docker的使用
8.1.2配置C 開發環境
8.2使用LibTorch部署PyTorch模型
8.2.1導出TorchScript模型
8.2.2將LibTorch加入CMake項目
8.2.3將輸入圖像轉換為Tensor
8.2.4加載TorchScript模型並進行推理
8.3用TensorRT部署模型

PyTorch 自動駕駛視覺感知算法實戰

劉斯坦

買這商品的人也買了...

相關主題

商品描述

作者簡介

目錄大綱

類似商品