機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來

洪錦魁 著

  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-1
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-2
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-3
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-4
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-5
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-6
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-7
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-8
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-9
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-10
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-11
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-12
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-13
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-14
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-15
  • 機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-16
機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來-preview-1

買這商品的人也買了...

商品描述

機器學習最強入門

基礎數學/機率/統計

邁向

AI真實數據 x 專題實作

 

★★★★★【數學原理 + 演算法 + 真實案例+ 專題實作】★★★★★

★★★★★【最簡明的數學機率統計知識】★★★★★

★★★★★【最完整的機器學習演算法】★★★★★

★★★★★【最豐富的真實數據 x 專題實作】★★★★★

 

本書特色如下:

  • 最白話解釋數學原理

從簡單的數據開始理解機器學習的演算法

  • 將理論知識轉化為實際的程式碼

實際案例分析

全書有約416Python程式實例,讀者可以由本書內容,了解下列與機器學習有關的基礎數學、機率、統計知識:

  • 方程式與函數

完整Python語法

一元函數到多元函數

最小平方法

基礎統計

機率與單純貝式理論

指數與對數

logit函數與logistic函數

向量與矩陣

二次函數、三次函數與多項式函數

當讀者有了上述知識後,筆者從簡單的實例開始介紹下列機器學習的演算法,每一種演算法皆是從基礎數據開始解說,然後跨入真實數據,解說應該如何將演算法應用到真實案例環境:

  • 線性迴歸 波士頓房價

邏輯迴歸 信用卡/葡萄酒/糖尿病

決策樹 葡萄酒/鐵達尼號/Telco/Retail

隨機森林樹 波士頓房價/鐵達尼號/Telco/收入分析

KNN演算法 電影推薦/足球射門/鳶尾花/小行星撞地球

支援向量機 鳶尾花/乳癌/汽車燃料

單純貝式分類 垃圾郵件/中英文的新聞分類/情感分析/電影評論

集成機器學習 蘑菇/醫療保險/玻璃/加州房價

K-means分群 購物中心消費/葡萄酒評價

PCA主成分分析 手寫數字/人臉數據

階層式分群 小麥數據/老實泉

DBSCAN演算法 購物中心客戶分析

在講解上述演算法時,筆者同時介紹下列機器學習應該知道的知識:

  • 特徵選擇

用直方圖了解特徵分佈

用箱型圖了解異常值

數據預處理

殘差圖(Residual plot)

機器學習性能評估

過擬合(overfitting)

欠擬合(underfitting)

數據洩漏(Data leakage)

繪製決策樹圖(Decision tree map)

可視化熱力圖(Heat map)

決策邊界(Decision Boundary)

增加數據維度與超平面

交叉驗證(Cross-validation)

泛化能力(Generalization Ability)

弱學習器(Weaks learners)

強學習器(Strong learners)

學習模型(base learner)

本書最後一章,介紹了熱門的AI主題「語音辨識」,從本章內容讀者可以學會下列知識:

語音轉文字

文字轉語音

 

本書所有程式實例可至深智官網下載:deepwisdom.com.tw

作者簡介

洪錦魁

 

  一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家。

 

  1. DOS時代他的代表作品是IBM PC組合語言、CC++Pascal、資料結構。
  2. Windows時代他的代表作品是Windows Programming使用CVisual Basic
  3. Internet時代他的代表作品是網頁設計使用HTML
  4. 大數據時代他的代表作品是R語言邁向Big Data之路。
  5. 人工智慧時代他的代表作品是機器學習基礎數/微積分 + Python實作。

 

作品曾被翻譯為簡體中文馬來西亞文英文,近年來作品則是在北京清華大學台灣深智同步發行:

1CJavaPythonC#R最強入門邁向頂尖高手之路王者歸來

2OpenCV影像創意邁向AI視覺王者歸來

3Python網路爬蟲:大數據擷取、清洗、儲存與分析王者歸來

4:演算法邏輯思維 + Python程式實作王者歸來

5Python2D3D資料視覺化

6網頁設計HTML+CSS+JavaScript+jQuery+Bootstrap+Google Maps王者歸來

7:機器學習彩色圖解 + 基礎數學、基礎微積分 + Python實作王者歸來

8Excel完整學習Excel函數庫Excel VBA應用王者歸來

9Python操作Excel最強入門邁向辦公室自動化之路王者歸來

10Power BI最強入門AI視覺化+智慧決策+雲端分享王者歸來

 

他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,各個時期暢銷排行榜第1名,他的著作最大的特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做解,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。

目錄大綱

1 章 機器學習基本觀念

1-1 人工智慧、機器學習、深度學習

1-2 認識機器學習

1-3 機器學習的種類

1-4 機器學習的應用範圍

1-5 深度學習

 

2 章 機器學習的基礎數學

2-1 用數字描繪事物

2-2 變數觀念

2-3 從變數到函數

2-4 等式運算的規則

2-5 代數運算的基本規則

2-6 用數學抽象化開餐廳的生存條件

2-7 基礎數學的結論

 

3 章 認識方程式/函數/座標圖形

3-1 認識方程式

3-2 方程式文字描述方法

3-3 一元一次方程式

3-4 函數

3-5 座標圖形分析

3-6 將線性函數應用在機器學習

3-7 二元函數到多元函數

3-8 Sympy 模組

 

4 章  從聯立方程式看機器學習的數學模型

4-1 數學觀念建立連接兩點的直線

4-2 機器學習使用聯立方程式推估數據

4-3 2 條直線的交叉點推估科學數據

4-4 兩條直線垂直交叉

 

5章 從畢氏定理看機器學習

5-1 驗證畢氏定理

5-2 將畢氏定理應用在性向測試

5-3 將畢氏定理應用在三維空間

5-4 將畢氏定理應用在更高維的空間

5-5 電影分類

5-6 計算兩個向量的歐幾里德距離

 

6章 聯立不等式與機器學習

6-1 聯立不等式與機器學習

6-2 再看聯立不等式的基本觀念

6-3 聯立不等式的線性規劃

6-4 Python 計算

 

7 章 機器學習需要知道的二次函數

7-1 二次函數的基礎數學

7-2 從一次到二次函數的實務

7-3 認識二次函數的係數

7-4 使用3 個點求解一元二次函數

7-5 二次函數的配方法

7-6 二次函數與解答區間

 

8 章 機器學習的最小平方法

8-1 最小平方法基本觀念

8-2 簡單的企業實例

8-3 機器學習建立含誤差值的線性方程式

8-4 Numpy 實作最小平方法

8-5 線性迴歸

8-6 實務應用

 

9 章 機器學習必須懂的集合

9-1 使用Python 建立集合

9-2 集合的操作

9-3 子集、宇集與補集

9-4 加入與刪除集合元素

9-5 冪集與Sympy 模組

9-6 笛卡兒積

 

10 章 機器學習必須懂的排列與組合

10-1 排列基本觀念

10-2 有多少條回家路

10-3 排列組合

10-4 階乘的觀念

10-5 重複排列

10-6 組合

 

11 章 機器學習需要認識的機率

11-1 機率基本觀念

11-2 數學機率與統計機率

11-3 事件機率名稱

11-4 事件機率規則

11-5 抽獎的機率 加法與乘法綜合應用

11-6 餘事件與乘法的綜合應用

11-7 條件機率

11-8 貝氏定理

11-9 蒙地卡羅模擬

11-10 Numpy 的隨機模組random

 

12 章 二項式定理

12-1 二項式的定義

12-2 二項式的幾何意義

12-3 二項式展開與規律性分析

12-4 找出xn-kyk 項的係數

12-5 二項式的通式

12-6 二項式到多項式

12-7 二項分佈實驗

12-8 將二項式觀念應用在業務數據分析

12-9 二項式機率分佈Python 實作

12-10 Numpy 隨機數模組的binomial( ) 函數

 

13 章 指數觀念與指數函數

13-1 認識指數函數

13-2 指數運算的規則

13-3 指數函數的圖形

 

14 章 對數(logarithm)

14-1 認識對數函數

14-2 對數表的功能

14-3 對數運算可以解決指數運算的問題

14-4 認識對數的特性

14-5 對數的運算規則與驗證

 

15 章 歐拉數與邏輯函數

15-1 歐拉數

15-2 邏輯函數

15-3 logit 函數

15-4 邏輯函數的應用

 

16 章 三角函數

16-1 直角三角形的邊長與夾角

16-2 三角函數的定義

16-3 計算三角形的面積

16-4 角度與弧度

16-5 程式處理三角函數

16-6 從單位圓看三角函數

16-7 三角函數與機器學習的關係

 

17 章 基礎統計與大型運算子

17-1 母體與樣本

17-2 數據加總

17-3 數據分佈

17-4 數據中心指標

17-5 數據分散指標

17-6 符號運算規則與驗證

17-7 活用符號

17-8 迴歸分析

17-9 隨機函數的分佈

 

18 章 機器學習的向量

18-1 向量的基礎觀念

18-2 向量加法的規則

18-3 向量的長度

18-4 向量方程式

18-5 向量內積

18-6 皮爾遜相關係數

18-7 向量外積

 

19 章 機器學習的矩陣

19-1 矩陣的表達方式

19-2 矩陣相加與相減

19-3 矩陣乘以實數

19-4 矩陣乘法

19-5 方形矩陣

19-6 單位矩陣

19-7 反矩陣

19-8 用反矩陣解聯立方程式

19-9 張量(Tensor)

19-10 轉置矩陣

 

20 章 向量、矩陣與多元線性回歸

20-1 向量應用在線性迴歸

20-2 向量應用在多元線性迴歸

20-3 矩陣應用在多元線性迴歸

20-4 將截距放入矩陣

20-5 簡單的線性迴歸

 

21 章 三次函數迴歸曲線的程式實作

21-1 繪製數據的散點圖

21-2 三次函數的迴歸曲線模型

21-3 使用scikit-learn 模組評估迴歸模型

21-4 預測未來值

21-5 不適合的三次函數迴歸數據

 

22 章 機器學習使用scikit-learn 入門

22-1 scikit-learn 的歷史

22-2 機器學習的數據集

22-3 scikit-learn 生成數據實作

22-4 scikit-learn 數據預處理

22-5 機器學習scikit-learn 入門

22-6 分類演算法 - 機器學習模型的性能評估

22-7 機器學習必需會的非數值資料轉換

22-8 機器學習演算法

22-9 使用隨機數據學習線性迴歸

 

23 章 線性迴歸 - 波士頓房價

23-1 從線性迴歸到多元線性迴歸

23-2 簡單資料測試

23-3 波士頓房價數據集

23-4 Pandas 顯示與預處理數據

23-5 特徵選擇

23-6 使用最相關的特徵做房價預估

23-7 多項式迴歸

23-8 用所有特徵執行波士頓房價預估

23-9 殘差圖(Residual plot)

23-10 梯度下降迴歸SGDRegressor( )

 

24 章  邏輯迴歸 - 信用卡/葡萄酒/糖尿病

24-1 淺談線性迴歸的問題

24-2 邏輯迴歸觀念回顧

24-3 邏輯迴歸模型基礎應用

24-4 台灣信用卡持卡人數據集

24-5 葡萄酒數據

24-6 糖尿病數據

 

25 章  決策樹 葡萄酒/鐵達尼號/Telco/Retail

25-1 決策樹基本觀念

25-2 從天氣數據認識決策樹設計流程 - 分類應用

25-3 葡萄酒數據 - 分類應用

25-4 鐵達尼號- 分類應用

25-5 Telco 電信公司- 分類應用

25-6 Retail Data Analytics - 迴歸應用

 

26 章  隨機森林樹 波士頓房價/鐵達尼號/Telco/收入分析

26-1 隨機森林樹基本觀念

26-2 波士頓房價 - 迴歸應用

26-3 鐵達尼號 分類應用

26-4 Telco 客戶流失 分類應用

26-5 美國成年人收入分析 分類應用

 

27 章  KNN 演算法 鳶尾花/小行星撞地球

27-1 KNN 演算法基礎觀念

27-2 電影推薦/ 足球射門 - 分類應用

27-3 房價計算/ 選舉準備香腸 迴歸應用

27-4 鳶尾花數據 - 分類應用

27-5 小行星撞地球 分類應用

 

28 章  支援向量機 鳶尾花/乳癌/汽車燃料

28-1 支援向量機的基礎觀念

28-2 支援向量機 - 分類應用的基礎實例

28-3 2 維到3 維的超平面

28-4 認識核函數

28-5 鳶尾花數據 - 分類應用

28-6 乳癌數據 - 分類應用

28-7 支援向量機 迴歸應用的基礎實例

28-8 汽車燃耗效率數據集 - 迴歸分析

 

29 章  單純貝式分類 垃圾郵件/新聞分類/電影評論

29-1 單純貝式分類原理

29-2 詞頻向量模組CountVerctorizer

29-3 多項式單純貝式模組 - MultinomialNB

29-4 垃圾郵件分類 Spambase 數據集

29-5 新聞郵件分類 新聞數據集20newsgroups

29-6 情感分析 電影評論IMDB Dataset 分析

29-7 單純貝式分類於中文的應用

29-8 今日頭條數據集

 

30 章  集成機器學習 蘑菇/ 醫療保險/玻璃/加州房價

30-1 集成學習的基本觀念

30-2 集成學習 - 投票法Voting (鳶尾花/波士頓房價)

30-3 集成學習 - 裝袋法Bagging (蘑菇/醫療保險)

30-4 集成學習 - 提升法AdaBoost(糖尿病/波士頓房價)

30-5 集成學習 - 提升法Gradient Boosting(玻璃/加州房價)

30-6 集成學習 堆疊法Stacking(信用卡違約/房價預估)

 

31 章  K-means 分群 購物中心消費/葡萄酒評價

31-1 認識無監督學習

31-2 K-means 演算法

31-3 scikit-learn KMeans 模組

31-4 評估分群的效能

31-5 最佳群集數量

31-6 消費分析 - 購物中心客戶消費數據

31-7 價格 vs 評價 - 葡萄酒Wine Reviews

 

32 章  PCA 主成份分析 手寫數字/人臉數據

32-1 PCA 基本觀念

32-2 鳶尾花數據的PCA 應用

32-3 數字辨識 - 手寫數字digits dataset

32-4 人臉辨識 人臉數據Labeled Faces in the Wild

 

33 章 階層式分層 小麥數據/老實泉

33-1 認識階層式分群

33-2 凝聚型(Agglomerative) 分群

33-3 小麥數據集Seeds dataset

33-4 老實泉數據Old Faithful Geyser Data

 

34 章  DBSCAN 演算法 購物中心客戶分析

34-1 DBSCAN 演算法

34-2 scikit-learn DBSCAN 模組

34-3 消費分析 - 購物中心客戶消費數據

 

35 章 語音辨識

35-1 語音轉文字

35-2 文字轉語音

 

附錄A 函數與方法索引表

附錄B 電子書 - 本書程式實例彩色執行結果圖表