實用機器學習 实用机器学习

蘇尼拉·格拉普蒂

買這商品的人也買了...

商品描述

本書探索了一系列廣泛應用的機器學習技術,用實際例子揭示了常見數據中隱藏的處理技巧和竅門。本書還探討了機器學習的前沿進展,提供了一些關於深度學習和強化學習的範例和指導原則,完美演繹了實操過程及算法原理。本書的目標讀者為那些想瞭解機器學習實踐通過機器學習技術解決現實應用的數據科學家。

作者簡介

關於作者Sunila Gollapudi擔任Broadridge金融解決方案(印度)有限公司的技術副總裁。該公司是美國Broadridge金融解決方案公司的全資子公司(BR)。她在IT服務領域擁有14年的豐富實踐經驗。她目前負責印度卓越架構中心,是大數據和數據科學計劃的領軍人物。
加入Broadridge之前,她在全球性領先機構擔任重要職位,專門從事Java、分佈式架構、大數據技術、高級分析、機器學習、語義技術和數據集成工具等領域的研發工作。Sunila是Broadridge在全球技術領導和創新論壇的理事,近在IEEE的工作是研究語義技術及其在業務數據湖中的作用。全球科技領域瞬息萬變,新的技術層出不窮,Sunila的個人優勢在於其密切關注並持續跟進全球科技,統上領下,串聯前後,實現業務交付的具體架構方案。她從計算機科學專業研究生畢業後的第一本出版著作是關於大數據數據倉庫解決方案Greenplum的,書名為《Getting Started with Greenplum for Big Data Analytics》(Packt出版社)。她有自己的孩子和家庭,此外她是一名享譽國內外的印度古典舞蹈家,還是一位畫家。
致謝首先,我要向Broadridge金融解決方案(印度)有限公司致以誠摯的謝意,感謝他們為我提供了一個追求技術的平台。
衷心感謝我的導師和公司董事總經理Laxmikanth V對我一如繼往的支持,並撰寫了推薦序。感謝國際工程學院(INSOFE)總裁Dakshinamurthy Kolluru博士發現了我對機器學習的熱情。此外,還要感謝我的企業架構導師、Canopus諮詢公司創始人Nagaraju Pappu先生。
在此要特別感謝Packt出版社給我這個著書立作的機會,以及在本書的出版發行中提供的全程支持。這是我們協作出版的第二本書,能與極富專業精神的出版界人士和評審專家協作讓我倍感榮幸。
感謝我的丈夫、家人和朋友一如既往的支持。我愧對的是可愛懂事的女兒Sai Nikita,在本書的編寫過程中她和我一樣心懷喜悅,但願每天能有超過24小時陪她一起度過!
後,拙作獻給技術領域所有不安分守己的大腦,是他們不懈追求,創新進取,才讓人們的生活更加美好,更加精彩紛呈。

目錄大綱

前言
關於作者
關於審校者
第1章機器學習簡介
1.1機器學習
1.1.1定義
1.1.2核心概念與術語
1.1.3什麼是學習
1.1.4機器學習中的數據不一致性
1.1.5機器學習實踐範例
1.1.6機器學習問題類型
1.2性能度量
1.3機器學習的相關領域
1.3.1數據挖掘
1.3.2人工智能
1.3.3統計學習
1.3.4數據科學
1.4機器學習處理流程及解決方案架構
1.5機器學習算法
1.5.1基於決策樹的算法
1.5.2基於貝葉斯的算法
1.5.3基於核方法的算法
1.5.4聚類算法
1.5.5人工神經網絡
1.5.6降維方法
1.5.7集成方法
1.5.8基於實例的算法
1.5.9基於回歸分析的算法
1.5.10基於關聯規則的算法
1.6機器學習工具與框架
1.7小結

第2章機器學習和大規模數據集
2.1大數據和大規模機器學習
2.1.1功能與架構:方法論的失配
2.1.2機器學習的可擴展性和性能
2.1.3模型選擇過程
2.1.4大規模機器學習的潛在問題
2.2算法和並發
2.3垂直擴展的機器學習技術方案
2.3.1MapReduce編程架構
2.3.2利用消息傳遞接口進行高性能計算
2.3.3LINQ框架
2.3.4使用LINQ操作數據集
2.3.5GPU 
2.3 .6FPGA 
2.3.7多核或多處理器系統
2.4小結

第3章Hadoop架構和生態系統簡介
3.1Apache Hadoop簡介
3.1.1Hadoop的演化
3.1.2Hadoop及其核心要素
3.2基於Hadoop的大數據機器學習解決方案架構
3.2 .1數據源層
3.2.2數據攝入層
3.2.3Hadoop數據存儲層
3.2.4Hadoop基礎設施層
3.2.5Hadoop平台/處理層
3.2.6分析層
3.2.7數據消費層
3.2.8MapReduce 
3.3Hadoop 2.x
3.3.1Hadoop生態系統組件
3.3.2Hadoop安裝和配置
3.3.3Hadoop發行版和供應商
3.4小結

第4章機器學習工具、庫及框架
4.1機器學習工具概覽
4.2Apache Mahout 
4.2.1Mahout如何工作
4.2.2安裝和設置Apache Mahout 
4.2.3Mahout軟件包詳解
4.2.4Mahout中的vector實現
4.3R 
4.3.1安裝和設置R 
4.3.2R與Apache Hadoop集成
4.4Julia 
4.4.1安裝和設置Julia 
4.4.2在命令行中執行Julia程序
4.4.3例解Julia 
4.4.4變量與賦值
4.4.5使用Julia的好處
4.4.6Julia與Hadoop集成
4.5Python 
4.5.1Python中工具包的選擇
4.5.2例解Python 
4.6Apache Spark 
4.6.1Scala 
4.6. 2RDD編程
4.7Spring XD 
4.8小結

第5章基於決策樹的學習
5.1決策樹
5.1.1術語
5.1.2目標與用途
5.1.3構造決策樹
5.1.4特殊的決策樹
5.2實現決策樹
5.3小結

第6章基於實例和核方法的學習
6.1基於實例的學習
6.1.1最近鄰
6.1 .2實現kNN 
6.2基於核方法的學習
6.2.1核函數
6.2.2支持向量機
6.2.3實現SVM 
6.3小結

第7章關聯規則學習
7.1關聯規則學習
7.1.1關聯規則的定義
7.1.2Apriori算法
7.1 .3FPgrowth算法
7.1.4Apriori與FPgrowth 
7.2實現Apriori及FPgrowth算法
7.3小結

第8章聚類學習
8.1聚類學習
8.2聚類的類型
8.2.1層次聚類
8.2.2劃分式聚類
8.3kmeans聚類算法
8.3.1kmeans算法的收斂性
8.3.2kmeans算法的優點
8.3.3kmeans算法的缺點
8.3.4距離度量
8.3.5複雜度度量
8.4實現kmeans聚類
8.5小結

第9章貝葉斯學習
9.1貝葉斯學習
9.1.1統計學家的視角
9.1.2貝葉斯定理
9.1.3樸素貝葉斯分類器
9.2實現樸素貝葉斯算法
9.3小結

第10章基於回歸的學習
10.1回歸分析
10.1.1重溫統計學
10.1.2混雜
10.1.3效應修飾
10.2回歸方法
10.2.1簡單線性回歸
10.2.2多元線性回歸
10.2.3多項式回歸
10.2.4廣義線性模型
10.2.5邏輯回歸(logit連接) 
10.2.6泊松回歸
10.3實現線性回歸和邏輯回歸
10.4小結

第11章深度學習
11.1背景知識
11.1.1人類大腦結構
11.1.2神經網絡
11.1 .3反向傳播算法
11.1.4Softmax回歸算法
11.2深度學習類型
11.2.1卷積神經網絡
11.2.2循環神經網絡
11.2.3受限玻爾茲曼機
11.2.4深度玻爾茲曼機
11.2.5自動編碼器
11.3實現ANN和深度學習方法
11.4小結

第12章強化學習
12.1強化學習
12.1.1強化學習的背景知識
12.1.2強化學習的主要特點
12.2強化學習算法
12.2.1動態規劃
12.2. 2蒙特卡羅方法
12.2.3時序差分學習
12.2.4Qlearning(異策略TD)
12.2.5actorcritic方法(同策略) 
12.2.6Rlearning(異策略)
12.3實現強化學習方法
12.4小結

第13章集成學習
13.1集成學習方法
13.1.1群體智慧
13.1.2經典應用
13.1.3集成方法
13.2實現集成學習方法
13.3小結

第14章下一代機器學習數據架構
14.1數據架構的演進
14.2機器學習的現代數據架構
14.2 .1語義數據架構
14.2.2多模型數據庫架構/混合持久化
14.2.3Lambda架構
14.3小結