機器學習的訓練資料 (Training Data for Machine Learning)
Anthony Chaudhary 著 楊新章 譯
- 出版商: 歐萊禮
- 出版日期: 2024-08-30
- 定價: $780
- 售價: 7.9 折 $616
- 語言: 繁體中文
- 頁數: 328
- 裝訂: 平裝
- ISBN: 6263248718
- ISBN-13: 9786263248717
-
相關分類:
Machine Learning
- 此書翻譯自: Training Data for Machine Learning: Human Supervision from Annotation to Data Science
立即出貨 (庫存 > 10)
買這商品的人也買了...
-
人月神話:軟體專案管理之道 (20 週年紀念版)(The Mythical Man-Month: Essays on Software Engineering, Anniversary Edition, 2/e)$480$379 -
軟體架構原理|工程方法 (Fundamentals of Software Architecture: A Comprehensive Guide to Patterns, Characteristics, and Best Practices)$680$537 -
經理人之道:技術領袖航向成長與改變的參考指南 (The Manager's Path: A Guide for Tech Leaders Navigating Growth and Change)$480$379 -
資料密集型應用系統設計 (Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems)$980$774 -
Deep Learning 4|用 Python 進行強化學習的開發實作$680$537 -
設計機器學習系統|迭代開發生產環境就緒的 ML 程式 (Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications)$780$616 -
Raspberry Pi 錦囊妙計|軟硬體問題與解決方案, 4/e (Raspberry Pi Cookbook: Software and Hardware Problems and Solutions, 4/e)$980$774 -
跟 NVIDIA 學深度學習!從基本神經網路到 ......、GPT、BERT...,紮穩機器視覺與大型語言模型 (LLM) 的建模基礎$880$748 -
Staff 工程師之路|獻給個人貢獻者成長與改變的導航指南 (The Staff Engineer's Path)$580$458 -
邊緣AI|使用嵌入式機器學習解決真實世界的問題 (AI at the Edge: Solving Real-World Problems with Embedded Machine Learning)$880$695 -
AI 神助攻!程式設計新境界 – GitHub Copilot 開發 Python 如虎添翼 : 提示工程、問題分解、測試案例、除錯$560$442 -
資料科學:困難部分 (Data Science: The Hard Parts: Techniques for Excelling at Data Science)$680$537 -
建構機器學習系統實踐指南$620$490 -
Vue 學習手冊 (Learning Vue: Core Concepts and Practical Patterns for Reusable, Composable, and Scalable User Interfaces)$680$537 -
LLM 大型語言模型的絕世祕笈:27路獨步劍法,帶你闖蕩生成式 AI 的五湖四海 (iThome鐵人賽系列書)$650$507 -
LLM 串接所有服務 - LangChain 原型到產品全面開發$680$537 -
資料庫內部原理|深入了解分散式資料系統的運作方式$780$616 -
機器學習與人工智慧深度問答集:從基礎到專業,提升 AI 知識力的 30道深度思考題 (Machine Learning Q and AI: 30 Essential Questions and Answers on Machine Learning and AI)$650$507 -
領域故事化:協作 x 視覺化 x Agile,輕鬆打造專業水準的 DDD 軟體 (Domain Storytelling: A Collaborative, Visual, and Agile Way to Build Domain-Driven Software)$650$507 -
具成本效益的資料管道 (Cost-Effective Data Pipelines)$680$537 -
Python 自學聖經:從程式素人到開發強者的技術、實戰與 AI 應用大全, 3/e (附影音/範例程式)$880$695 -
資料工程基礎|規劃和建構強大、穩健的資料系統 (Fundamentals of Data Engineering)$980$774 -
AI 應用程式開發|活用 ChatGPT 與 LLM 技術開發實作, 2/e (Developing Apps with GPT-4 and ChatGPT: Build Intelligent Chatbots, Content Generators, and More, 2/e)$680$537 -
生成式 AI 專案實踐指南:從模型挑選、上線、RAG 技術到 AI Agent 整合$650$507 -
深入淺出軟體架構 (Head First Software Architecture)$980$774
商品描述
從標註到資料科學的人類監督
掌握訓練資料的訣竅,提升AI專案成功率
「本書以全方位的視角解說如何產生高品質的訓練資料以及啟動新專案。」
— Anirudh Koul
Pinterest機器學習、資料科學負責人
「要做好機器學習,必須學習如何訓練資料。本書的價值比黃金還要珍貴。」
— Neal Linson
InCite Logix首席資料與分析長,LLM超級明星
您的訓練資料對於資料專案的成功與否與演算法本身一樣重要,因為人工智慧系統的大多數失敗都與訓練資料有關。儘管訓練資料是成功的人工智慧與機器學習的基礎,但鮮少有全面的資源可以幫助您掌握這一過程。
在這本實用指南中,作者Anthony Sarkis(Diffgram AI訓練資料軟體的首席工程師)向技術專業人員、管理者和相關領域專家展示如何處理和擴展訓練資料,同時闡述監督機器的人性面。無論是工程領導者、資料工程師或是資料科學專業人士,都能從本書獲得成功使用訓練資料所需之概念、工具和流程的深入理解。
透過這本書,您將學會:
‧有效地處理訓練資料,包括綱要、原始資料和標註
‧將工作、團隊或組織轉型為更以人工智慧/機器學習資料為中心
‧向其他員工、團隊成員和利益相關者清楚解釋訓練資料概念
‧為生產級別的人工智慧應用設計、部署和交付訓練資料
‧識別並修正基於新訓練資料的失敗模式,如資料偏差
‧完全掌握自動化技術,更有效地建立訓練資料
‧成功維護、操作和改進訓練資料的記錄系統
作者簡介
Anthony Sarkis 是Diffgram AI訓練資料軟體的首席工程師,也是Diffgram Inc.技術長兼創始人。在此之前,他曾是Skidmore、Owings & Merrill軟體研發工程師,並共同創立了DriveCarma.ca。
目錄大綱
前言
第 01 章 訓練資料導論
訓練資料的意圖
訓練資料的機會
訓練資料的重要性
真實的訓練資料
生成式人工智慧
總結
第 02 章 快速上手
引言
快速上手
工具概述
取捨
歷史
總結
第 03 章 綱要
深入介紹綱要
標籤和屬性:內容
空間表達法:在哪裡?
關係、序列、時間序列:何時?
指南和說明
機器學習任務與訓練資料的關係
通用概念
總結
第 04 章 資料工程
引言
原始資料儲存
格式和映射
資料存取
安全性
預標記
總結
第 05 章 工作流程
引言
技術和人之間的黏合劑
開始人類任務
品質保證
分析
模型
資料流
直接標註
總結
第 06 章 理論、概念和維護
引言
理論
一般概念
樣本建立
維護
訓練資料管理
總結
第 07 章 人工智慧轉型與應用案例
引言
人工智慧轉型
任命領導者:人工智慧資料主管
使用案例發現
新的「群眾外包」:您自己的專家
現代訓練資料工具
總結
第 08 章 自動化
引言
入門
取捨
預標記
互動式標註自動化
品質保證自動化
資料發掘:應該標記的內容
擴增
模擬和合成資料
媒體特定
特定於領域
總結
第 09 章 案例研究和故事
引言
產業
訓練資料的學術方法
總結
索引









