機器學習實踐應用 机器学习实践应用

李博

  • 出版商: 人民郵電
  • 出版日期: 2017-07-01
  • 定價: $414
  • 售價: 7.9$327
  • 貴賓價: 7.5$311
  • 語言: 簡體中文
  • 頁數: 266
  • 裝訂: 平裝
  • ISBN: 7115460418
  • ISBN-13: 9787115460417
  • 相關分類: Machine Learning
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

商品描述

機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度等多門學科,專門研究電腦怎樣模擬或實現人類的學習行為。機器學習是人工智能的核心,是使電腦具有智能的根本途徑。
本書通過對機器學習的背景知識、算法流程、相關工具、實踐案例以及知識圖譜等內容的講解,全面介紹了機器學習的理論基礎和實踐應用。書中涉及機器學習領域的多個典型算法,並詳細給出了機器學習的算法流程。
本書適合任何有一定數據功底和編程基礎的讀者閱讀。通過閱讀本書,讀者不僅可以瞭解機器學習的理論基礎,也可以參照一些典型的應用案例拓展自己的專業技能。同時,本書也適合電腦相關專業的學生以及對人工智能和機器學習感興趣的讀者閱讀。


通過閱讀本書,你將瞭解到:

■ 機器學習全流程的串聯方式,包括數據預處理、特徵工程、算法、模型評估等;
■ zui常用的機器學習算法,包括邏輯回歸、隨機森林、支持向量機、KMEANS、DBSCAN、K近鄰、
馬爾科夫決策、LDA、標籤傳播等;
■ 機器學習算法在實際業務中的應用,涉及金融、醫療、新聞、電商等諸多領域;
■ 機器學習的常用工具:R、Spark-MLib、TensorFlow、PAI等;
■ 時下zui熱門的技術領域:深度學習、知識圖譜等。

第1部分機器學習的背景知識

■ 機器學習的發展歷史以及現狀
■ 機器學習的基本概念

第2部分機器學習的算法流程

■ 場景解析
■ 數據預處理
■ 特徵工程
■ 機器學習常規算法——分類算法、聚類算法、回歸算法、文本分析算法、推薦算法和關係圖算法
■深度學習算法——常用的3種模型DNN、CNN和RNN 

第3部分機器學習的相關工具

■ SPSS和R語言等單機統計分析環境
■ 分佈式的算法框架Spark MLib和TensorFlow 
■ 企業級的雲算法服務AWS ML和阿裡雲PAI 

第4部分機器學習算法的實踐案例

■ 心臟病預測
■ 商品推薦
■ 金融風控
■ 新聞分類
■ 貸款預測
■ 霧霾天氣預報
■ 圖片識別

第5部分知識圖譜

 

這是一本難得的面向機器學習愛好者的入門級教程,本書涉及機器學習的基礎理論和深度學習等相關內容,內容深入淺出。更加難能可貴的是,本書基於阿裡雲機器學習平臺,針對7個具體的業務場景,搭建了完整的解決方案,給讀者帶來第壹手的實戰演練經驗。
——阿裡雲資深專家褚崴

機器學習算法正在逐漸滲透到數據化運營的各個方面,算法和業務數據相結合可以大幅度地提高業務效率、降低成本。本書以算法的業務應用作為切入點,包含大量的案例說明,非常適合讀者快速入門。
——阿裡雲高級專家陳鵬宇

作者簡介

李博,花名傲海。目前任阿里雲數據產品經理,主要負責機器學習平台的產品化建設以及對外業務應用。本科、碩士畢業於北京郵電大學,曾就職於索尼和華為(實習),從事數據相關產品的開發。作為CSDN博客專家、雲棲社區博客專家,長期分享IT技術相關文章,內容涉及機器學習算法、Android應用及源碼開發等領域。一直活躍於開發者社區,主導開發了多個GitHub百星開源項目,還開發並上線了多款手機App。

作者微信公眾號(長期更新機器學習業務應用文章):凡人機器學習個人網站:www.garvinli.com作者郵箱:garvin.libo@gmail.com

目錄大綱

第1部分背景知識

第1章機器學習概述3 

1.1背景3 
1.2發展現狀6 
1.2.1數據現狀6 
1.2.2機器學習算法現狀8 
1.3機器學習基本概念12 
1.3.1機器學習流程12 
1.3.2數據源結構14 
1.3.3算法分類16 
1.3.4過擬合問題18 
1.3.5結果評估20 
1.4本章小結22 

第2部分算法流程

第2章場景解析25 

2.1數據探查25 
2.2場景抽象27 
2.3算法選擇29 
2.4本章小結31 

第3章數據預處理32 

3.1採樣32 
3.1.1隨機採樣32 
3.1.2系統採樣34 
3.1.3分層採樣35 
3.2歸一化36 
3.3去除噪聲39 
3.4數據過濾42 
3.5本章小結43 

第4章特徵工程44 

4.1特徵抽象44 
4.2特徵重要性評估49 
4.3特徵衍生53 
4.4特徵降維57 
4.4.1特徵降維的基本概念57 
4.4.2主成分分析59 
4.5本章小結62 

第5章機器學習算法——常規算法63 

5.1分類算法63 
5.1.1 K近鄰63 
5.1.2樸素貝葉斯68 
5.1.3邏輯回歸74 
5.1.4支持向量機81 
5.1.5隨機森林87 
5.2聚類算法94 
5.2 .1 K—means 97 
5.2.2 DBSCAN 103 
5.3回歸算法109 
5.4文本分析算法112 
5.4.1分詞算法——Hmm 112 
5.4.2 TF—IDF 118 
5.4.3 LDA 122 
5.5推薦類算法127 
5.6關係圖算法133 
5.6.1標籤傳播134 
5.6.2 Dijkstra最短路徑138 
5.7本章小結145 

第6章機器學習算法——深度學習146 

6.1深度學習概述146 
6.1.1深度學習的發展147 
6.1.2深度學習算法與傳統算法的比較148 
6.2深度學習的常見結構152 
6.2.1深度神經網絡152 
6.2.2卷積神經網絡153 
6.2.3循環神經網絡156 
6.3本章小結157 

第3部分工具介紹

第7章常見機器學習工具介紹161 

7.1概述161 
7.2單機版機器學習工具163 
7.2.1 SPSS 163 
7.2.2 R語言167 
7.2.3工具對比172 
7.3開源分佈式機器學習工具172 
7.3.1 SparkMLib 172 
7.3.2 TensorFlow 179 
7.4企業級雲機器學習工具190 
7.4.1亞馬遜AWSML 191 
7.4 .2阿里雲機器學習PAI 196 
7.5本章小結205 

第4部分實戰應用

第8章業務解決方案209 

8.1心髒病預測209 
8.1.1場景解析209 
8.1.2實驗搭 211 
8.1.3小結216 
8.2商品推薦系統216 
8.2.1場景解析217 
8.2.2實驗搭建218 
8.2.3小結220 
8.3金融風控案例220 
8.3.1場景解析221 
8.3.2實驗搭建222 
8.3.3小結225 
8.4新聞文本分析225 
8.4.1場景解析225 
8.4.2實驗搭建226 
8.4.3小結230 
8.5農業貸款發放預測230 
8.5.1場景解析230 
8.5.2實驗搭建232 
8.5.3小結236 
8.6霧霾天氣成因分析236 
8.6.1場景解析237 
8.6.2實驗搭建238 
8.6.3小結243 
8.7圖片識別243 
8.7.1場景解析243 
8.7.2實驗搭建245 
8.7.3小結253 
8.8本章小結253 

第5部分知識圖譜

第9章知識圖譜257 

9.1未來數據採集257 
9.2知識圖譜的概述259 
9.3知識圖譜開源工具261 
9.4本章小結264 
參考文獻265