scikit learn機器學習:常用算法原理及編程實戰 scikit learn机器学习:常用算法原理及编程实战

黃永昌

  • 出版商: 機械工業
  • 出版日期: 2018-03-01
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • 頁數: 207
  • 裝訂: 平裝
  • ISBN: 7111590244
  • ISBN-13: 9787111590248
  • 相關分類: Machine Learning
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

商品描述

本書通過通俗易懂的語言、豐富的圖示和生動的實例,撥開了籠罩在機器學習上方復雜的數學“烏雲”,讓讀者以較低的代價和門檻入門機器學習。

本書共分為11章,介紹了在Python環境下學習scikit—learn機器學習框架的相關知識,涵蓋的主要內容有機器學習概述、Python機器學習軟件包、機器學習理論基礎、k—近鄰算法、線性回歸算法、邏輯回歸算法、決策樹、支持向量機、樸素貝葉斯算法、PCA算法和k—均值算法等。

本書適合有一定編程基礎的讀者閱讀,尤其適合想從事機器學習、人工智能、深度學習及機器人相關技術的程序員和愛好者閱讀。

作者簡介

黃永昌

2004年畢業於廈門大學自動化系。

畢業後一直在夏新電子從事手機系統軟件的研發,直至2009年轉向Android系統軟件開發。

熟悉C、Python、Java和JavaScript等多種開發語言。

對數據處理及分析有濃厚的興趣,於2014年開始學習和研究機器學習及數據挖掘領域的相關知識。

2015年加入ABB集團,從事智能家居系統的開發,通過分析服務器及客戶端日誌數據,為智能家居系統開發智能決策模型。

目錄大綱

前言
第1章機器學習介紹1 
1.1什麼是機器學習1 
1.2機器學習有什麼用2 
1.3機器學習的分類3 
1.4機器學習應用開發的典型步驟4 
1.4.1數據採集和標記4 
1.4.2數據清洗5 
1.4.3特徵選擇5 
1.4.4模型選擇5 
1.4.5模型訓練和測試5 
1.4.6模型性能評估和優化5 
1.4.7模型使用6 
1.5複習題6 
第2章Python機器學習軟件包7 
2.1開發環境搭建7 
2.2 IPython簡介8 
2.2.1 IPython基礎8 
2.2.2 IPython圖形界面13 
2.3 Numpy簡介15 
2.3.1 Numpy數組15 
2.3.2 Numpy運算19 
2.4 Pandas簡介32 
2.4.1基本數據結構32 
2.4.2數據排序34 
2.4.3數據訪問34 
2.4.4時間序列36 
2.4.5數據可視化36 
2.4.6文件讀寫38 
2.5 Matplotlib簡介38 
2.5.1圖形樣式38
2.5.2圖形對象40 
2.5.3畫圖操作46 
2.6 scikit—learn簡介51 
2.6.1 scikit—learn示例51 
2.6.2 scikit—learn一般性原理和通用規則55 
2.7複習題56 
2.8拓展學習資源57 
第3章機器學習理論基礎58 
3.1過擬合和欠擬合58 
3.2成本函數59 
3.3模型準確性60 
3.3.1模型性能的不同表述方式61 
3.3.2交叉驗證數據集61 
3.4學習曲線62 
3.4.1實例:畫出學習曲線62 
3.4.2過擬合和欠擬合的特徵65 
3.5算法模型性能優化65 
3.6查准率和召回率66 
3.7 F1 Score67 
3.8複習題67 
第4章k—近鄰算法69 
4.1算法原理69 
4.1.1算法優缺點69 
4.1.2算法參數70 
4.1.3算法的變種70 
4.2示例:使用k—近鄰算法進行分類70 
4.3示例:使用k—近鄰算法進行回歸擬合72 
4.4實例:糖尿病預測74 
4.4.1加載數據74 
4.4.2模型比較75 
4.4.3模型訓練及分析77
4.4.4特徵選擇及數據可視化78 
4.5拓展閱讀80 
4.5.1如何提高k—近鄰算法的運算效率80 
4.5.2相關性測試80 
4.6複習題81 
第5章線性回歸算法83 
5.1算法原理83 
5.1. 1預測函數83 
5.1.2成本函數84 
5.1.3梯度下降算法84 
5.2多變量線性回歸算法86 
5.2.1預測函數86 
5.2.2成本函數87 
5.2.3梯度下降算法88 
5.3模型優化89 
5.3.1多項式與線性回歸89 
5.3.2數據歸一化89 
5.4示例:使用線性回歸算法擬合正弦函數90 
5.5示例:測算房價92 
5.5.1輸入特徵92 
5.5.2模型訓練93 
5.5.3模型優化94 
5.5 .4學習曲線95 
5.6拓展閱讀96 
5.6.1梯度下降迭代公式推導96 
5.6.2隨機梯度下降算法96 
5.6.3標準方程97 
5.7複習題97 
第6章邏輯回歸算法98 
6.1算法原理98 
6.1.1預測函數98 
6.1.2判定邊界99
6.1.3成本函數100 
6.1.4梯度下降算法102 
6.2多元分類102 
6.3正則化103 
6.3.1線性回歸模型正則化103 
6.3.2邏輯回歸模型正則化104 
6.4算法參數104 
6.5實例:乳腺癌檢測106 
6.5.1數據採集及特徵提取106 
6.5.2模型訓練108 
6.5.3模型優化110 
6.5.4學習曲線111 
6.6拓展閱讀113 
6.7複習題114 
第7章決策樹115 
7.1算法原理115 
7.1.1信息增益116 
7.1.2決策樹的創建119 
7.1.3剪枝算法120 
7.2算法參數121 
7.3實例:預測泰坦尼克號倖存者122 
7.3.1數據分析122 
7.3.2模型訓練123 
7.3.3優化模型參數124 
7.3 .4模型參數選擇工具包127 
7.4拓展閱讀130 
7.4.1熵和條件熵130 
7.4.2決策樹的構建算法130 
7.5集合算法131 
7.5.1自助聚合算法Bagging131 
7.5.2正向激勵算法boosting131
7.5.3隨機森林132 
7.5.4 ExtraTrees算法133 
7.6複習題133 
第8章支持向量機134 
8.1算法原理134 
8.1.1大間距分類算法134 
8.1.2鬆弛係數136 
8.2核函數138 
8.2.1最簡單的核函數138 
8.2.2相似性函數140 
8.2.3常用的核函數141 
8.2.4核函數的對比142 
8.3 scikit—learn裡的SVM144 
8.4實例:乳腺癌檢測146 
8.5複習題149 
…… 
第9章樸素貝葉斯算法151 
第10章PCA算法168 
第11章k—均值算法190 
後記205