數據標註項目化實用教程

李奇功,殷兵,劉穎

  • 出版商: 電子工業
  • 出版日期: 2026-04-01
  • 售價: $252
  • 語言: 簡體中文
  • 頁數: 188
  • ISBN: 7121525577
  • ISBN-13: 9787121525575
  • 相關分類: Data-mining
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書立足高等職業院校人才培養需求,同時適用於數據標註行業初級階段從業者崗前培訓。全書以實訓為核心,聚焦數據標註崗位核心技能,其內容涵蓋文本、圖像、音頻、視頻四大標註類型,采用“任務背景→任務分析→相關知識→任務實施”的實操體例,依托數據堂實訓平臺設計真實的任務案例。本書弱化理論灌輸,強化實戰訓練,精準對接行業標準與企業需求,助力學習者快速掌握數據標註流程、質量管控要點及工具操作方法,是培養高素質數據標註技能型人才的實用教程。

目錄大綱

項目1 數據標註概況——標註解讀AI密碼 1
學習目標 1
項目導讀 2
思維導圖 2
1.1 初識數據標註 3
1.2 數據標註溯源 3
1.2.1 初創期的“手動標註時代”(1956年—2005年) 4
1.2.2 起步階段的“外包探索期”(2006年—2015年) 4
1.2.3 爆發式增長的“行業成型期”(2016年—2018年) 5
1.2.4 質量與智能驅動的“產業升級期”(2019年至今) 6
1.2.5 數據標註的進化邏輯與核心價值 7
1.3 數據標註的分類 8
1.3.1 圖像標註 8
1.3.2 文本標註 9
1.3.3 音頻標註 10
1.3.4 視頻標註 11
1.4 數據標註工具 11
1.4.1 標註工具的本質 11
1.4.2 標註工具的分類 11
1.4.3 標註工具的共性特征與選型原則 16
1.5 數據標註的人機協同模式 16
1.6 數據安全、標註規範與應用 17
1.6.1 賬號權限管理 17
1.6.2 數據安全管理 18
1.6.3 標註全流程解析 19
1.6.4 數據標註的重要性 20
1.6.5 數據標註的應用場景 20
1.6.6 數據標註員的角色蛻變 24
項目小結 27
課後習題 27
項目2 圖像標註——讓機器“看懂”世界 30
學習目標 30
項目導讀 31
思維導圖 31
2.1 圖像數據標註的核心認知 32
2.1.1 圖像數據的基礎 32
2.1.2 圖像標註的重要性 33
2.1.3 圖像標註的流程 34
2.2 圖像標註典型實戰任務案例 36
2.2.1 任務1:畫線標註——無人駕駛道路線標註 36
2.2.2 任務2:邊界框標註——監控場景行人檢測標註 42
2.2.3 任務3:簡單關鍵點標註——人臉5關鍵點標註 47
2.2.4 任務4:復雜關鍵點標註——手勢21關鍵點標註 50
2.2.5 任務5:簡單多邊形標註——監控場景行人檢測摳圖 57
2.2.6 任務6:復雜多邊形標註——無人駕駛全品類精細標註 61
2.2.7 任務7:屬性標註——監控場景行人屬性標註 65
2.2.8 任務8:OCR識別標註——OCR票據標註 69
2.2.9 任務9:3D點雲標註——3D點雲圖物體單幀標註 73
項目小結 79
課後習題 80
項目3 文本標註——讓機器“讀懂”文字 84
學習目標 84
項目導讀 85
思維導圖 85
3.1 文本標註基礎 86
3.1.1 文本標註的基本概念 86
3.1.2 文本標註的重要性 88
3.1.3 文本標註的基本流程 89
3.2 文本標註典型實戰任務案例 89
3.2.1 任務1:序列標註——新聞稿件詞性標註 89
3.2.2 任務2:實體關系標註——汽修文本實體關系標註 96
3.2.3 任務3:文本屬性標註——數字拼音標註 101
3.2.4 任務4:文本分類標註——用戶評論情感標註 104
3.2.5 任務5:文本理解標註——語文輔導閱讀理解標註 107
3.2.6 任務6:意圖理解標註——鬧鐘設定意圖標註 110
項目小結 113
課後習題 114
項目4 音頻標註——讓機器“聽懂”世界 117
學習目標 117
項目導讀 118
思維導圖 118
4.1 音頻標註的核心認知 119
4.1.1 音頻數據的基礎 119
4.1.2 音頻標註的定義 120
4.1.3 音頻標註的重要性 121
4.1.4 音頻標註的分類 121
4.1.5 音頻標註的規則 122
4.2 音頻標註典型實戰任務案例 123
4.2.1 任務1:音頻分類標註——語音有效性判斷 123
4.2.2 任務2:語音轉寫標註——數字串朗讀語音標註 128
4.2.3 任務3:語音分割標註——對話語音標註 132
4.2.4 任務4:情感標註——客服語音標註 138
4.2.5 任務5:意圖標註——語音助手語音標註 141
4.2.6 任務6:輕口音朗讀語音標註——輕口音語音標註 144
4.2.7 任務7:重口音朗讀語音標註——重口音語音標註 147
項目小結 149
課後習題 150
項目5 視頻標註——讓AI“洞察”時空 153
學習目標 153
項目導讀 154
思維導圖 154
5.1 視頻標註的核心認知 154
5.1.1 視頻數據的基礎 154
5.1.2 視頻標註的定義 156
5.1.3 視頻標註的重要性 156
5.1.4 視頻標註的主要類型 157
5.2 視頻標註典型實戰任務案例 158
5.2.1 任務1:視頻屬性標註——人物屬性標註 158
5.2.2 任務2:時間區間標註——打架異常行為標註 163
5.2.3 任務3:目標追蹤標註——車輛視頻軌跡標註 167
5.2.4 任務4:多模態理解標註——多模態情感標註 173
項目小結 176
課後習題 177