超越多顯卡多機器:分散式機器學習超速實戰
陳敬雷 編著
- 出版商: 深智
- 出版日期: 2021-11-20
- 定價: $1,000
- 售價: 7.9 折 $790
- 語言: 繁體中文
- 頁數: 616
- 裝訂: 平裝
- ISBN: 9860776547
- ISBN-13: 9789860776546
-
相關分類:
Spark、Machine Learning
- 此書翻譯自: 分佈式機器學習實戰
立即出貨(限量) (庫存=4)
買這商品的人也買了...
-
Verilog 硬體描述語言 (Verilog HDL: A Guide to Digital Design and Synthesis, 2/e)$480$432 -
一次就學會 Verilog 與 VHDL$630$599 -
無瑕的程式碼-敏捷軟體開發技巧守則 (Clean Code: A Handbook of Agile Software Craftsmanship)$580$452 -
極詳細 + 超深入:最新版 TensorFlow 1.x/2.x 完整工程實作$1,200$948 -
特徵工程不再難:資料科學新手也能輕鬆搞定! (Feature Engineering Made Easy: Identify unique features from your dataset in order to build powerful machine learning systems)$520$406 -
基於 GPU 加速的計算機視覺編程:使用 OpenCV 和 CUDA 實時處理複雜圖像數據$474$450 -
Python 機器學習與深度學習特訓班:看得懂也會做的AI人工智慧實戰, 2/e (附120分鐘影音教學/範例程式)$520$411 -
$551OpenCV 4 機器學習算法原理與編程實戰 -
資料科學的建模基礎 : 別急著 coding!你知道模型的陷阱嗎?$599$509 -
超大流量系統解決方案 : 大型網站架構師的經驗分享$690$538 -
跟著 Docker 隊長,修練 22天就精通 - 搭配 20小時作者線上教學,無縫接軌 Microservices、Cloud-native、Serverless、DevOps 開發架構$880$695 -
你所不知道的必學前端 Debug 技巧:即學即用!讓你 Debug 不求人 (iT邦幫忙鐵人賽系列書)$620$484 -
$653Pandas 數據預處理詳解 -
最速網頁開發:用 Go Web 一手建立高能效網站系統$880$695 -
人工智慧再進化:聯邦學習讓資料更安全穩固$880$695 -
Python 大數據專案 X 工程 X 產品 資料工程師的升級攻略$700$553 -
AWS CDK 完全學習手冊:打造雲端基礎架構程式碼 IaC(iT邦幫忙鐵人賽系列書)$600$468 -
AI 硬體專屬晶片:最新技術未來創新發展$1,000$850 -
突破困境!企業開源虛擬化管理平台:使用 Proxmox Virtual Environment (iThome鐵人賽系列書)$620$484 -
AutoML 自動化機器學習:用 AutoKeras 超輕鬆打造高效能 AI 模型 (Automated Machine Learning with AutoKeras: Deep learning made accessible for everyone with just few lines of coding)$690$545 -
pytest 框架與自動化測試應用$600$570 -
打下最紮實 AI 基礎不依賴套件:手刻機器學習神經網路穩健前進$1,200$948 -
打好 AI 的基礎:一探機器學習底層數學運作$880$695 -
不只是 CUDA,通用 GPU 程式模型及架構原理$780$616 -
萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰$1,280$1,011
商品描述
在Hadoo/Spark/Mahout/Tensorflow上跑多機器多片GPU的機器學習
機器學習在神經網路和GPU流行起來之後大放異彩,連販夫走足都CNN/RNN朗朗上口,然而許多企業/研究機關/學校在花了大筆預算購買昂貴的硬體時,卻不知如何採購,更不用說如何應用這些硬體來進行研發或產品開發了。本書作者是知名電商的創辦人,其不止在機器學習上有十足的實務經驗,在面對大量資料的場景下,更能利用前人的智慧,用上了Big Data最流行的Hadoop/Spark平台。尤有甚者,在新一代的AI函數庫面世時,也能充分利用這些函數庫的GPU加速,將多機器,多GPU的資源應用在大型專案上。
▌業界獨有
全書以Hadoop/Spark為基礎,加上使用了最流行的TensorFlow on Hadoop,更使用了分散式系統最老牌的Mahout,有別於一般只介紹Python/TensorFlow的坊間書籍,是市場上唯一僅有完整從Hadoop一直延伸到神經網路。
▌內容完整豐富
本書以分散式機器學習為主線,以實戰為主要目的。共分為8章,分別介紹網際網路公司巨量資料和人工智慧、巨量資料演算法系統架構、巨量資料基礎、Docker容器、Mahout分散式機器學習平台、Spark分散式機器學習平台、分散式深度學習實戰、完整工業級系統實戰(推薦演算法系統實戰、人臉辨識實戰、對話機器人實戰)等內容。
適合讀者
適合分散式機器學習的初學者閱讀,對於有一定經驗的分散式巨量資料方向的從業人員及演算法工程師,也可以從書中獲取很多有價值的知識,並透過實戰專案更佳地理解分散式機器學習的核心內容。
作者簡介
陳敬雷
充電了麼創始人。擁有十幾年互聯網從業經驗,在技術領域,尤其在大數據和人工智慧方向有豐富的演算法工程落地實戰經驗。目前專注於大數據和人工智慧驅動的上班族線上教育行業,研發了充電了麼App,用深度學習演算法、NLP、推薦引擎等技術來高效提升線上學習效率。
目錄大綱
第1 章 網際網路公司巨量資料和人工智慧那些事
1.1 巨量資料和人工智慧在網際網路公司扮演的角色和重要性
1.2 巨量資料部門組織架構和各種職務介紹
第2 章 巨量資料演算法系統架構
2.1 經典應用場景
2.2 應用系統架構設計
第3 章 巨量資料基礎
3.1 Hadoop 巨量資料平台架設
3.2 Hive 資料倉儲實戰
3.3 HBase 實戰
3.4 Sqoop 資料ETL 工具實戰
3.5 Spark 基礎
第4 章 Docker 容器
4.1 Docker 介紹
4.2 Docker 容器部署
第5 章 Mahout 分散式機器學習平台
5.1 Mahout 採擷平台
5.2 Mahout 機器學習演算法
第6 章 Spark 分散式機器學習平台
6.1 Spark 機器學習函數庫
6.2 各個演算法介紹和程式設計實戰
第7 章 分散式深度學習實戰
7.1 TensorFlow 深度學習框架
7.2 MXNet 深度學習框架
7.3 神經網路演算法
第8 章 完整工業級系統實戰
8.1 推薦演算法系統實戰
8.2 人臉辨識實戰
8.3 對話機器人實戰
參考文獻

















