大話機器學習 — 原理|算法|建模|代碼 30講

葉新江

預覽內頁

出版商: 清華大學
出版日期: 2023-06-01
定價: $714
售價: 8.5 折 $607
語言: 簡體中文
頁數: 301
裝訂: 平裝
ISBN: 7302628629
ISBN-13: 9787302628620
相關分類: Machine Learning

立即出貨 (庫存 < 4)

買這商品的人也買了...

~~$474~~ $450

深入理解 Kotlin 協程
~~$820~~ $640

圖解 TensorFlow 2 初學篇：實作 tf.keras + Colab 雲端、深度學習、人工智慧、影像辨識
$458

自然語言處理之 BERT 模型算法、架構和案例實戰
~~$650~~ $487

駕馭 ChatGPT 4: 探索 Azure OpenAI 與 Cognitive Service for Language 開發實踐 (使用.NET 與 Node.js)
~~$760~~ $532

ChatGPT4 人工智慧新時代：超效率 AI 生活與工作實務應用
$401

矽基物語.AI大爆炸
~~$700~~ $553

GPT4 會你也會 - 共融機器人的多模態互動式情感分析
~~$560~~ $442

從 AI 到生成式 AI：40個零程式的實作體驗，培養新世代人工智慧素養
~~$650~~ $455

AWS 雲端運算基礎與實作
~~$768~~ $730

Kubernetes 從入門到 DevOps 企業應用實戰
~~$454~~ $427

從零開始大模型開發與微調：基於 PyTorch 與 ChatGLM
~~$534~~ $507

自然語言處理與應用
~~$750~~ $593

最強 AI 投資分析：打造自己的股市顧問機器人，股票趨勢分析×年報解讀×選股推薦×風險管理
~~$594~~ $564

內容理解：技術、演算法與實踐
~~$650~~ $507

Vue.js 3 前端開發不踩雷：Composition API × Vue Router × Pinia，帶你快速升級進階開發者！（iThome鐵人賽系列書）【軟精裝】
$356

LangChain 編程：從入門到實踐

商品描述

本書是作者多年在數據智能領域中利用機器學習實戰經驗的理解、歸納和總結。出於“回歸事物本質，規律性、系統性地思考問題”“理論為實踐服務並且反過來充實理論，為更多人服務”的想法和初心，本書系統地闡述了機器學習理論和工程方法論，並結合實際商業場景落地。全書分為3部分。第1部分是機器學習的數學理論理解，這部分不是對於機器學習數學理論的嚴謹推導和證明，更多是對於理論背後的“到底是什麽，為什麽要這樣做”的通俗理解。盡可能通過對應到日常生活中的現象來進行講述。第2部分是機器學習模型、方法及本質，這一部分針對機器學習的方法論及具體的處理過程進行闡述。涉及數據準備、異常值的檢測和處理、特徵的處理、典型模型的介紹、代價函數、激活函數及模型性能評價等，是本書的核心內容。我們學習知識的主要目的是解決問題，特別是對於企業的從業人員，對在商業實戰環境中出現的問題，希望通過機器學習的方式來更好地解決。第3部分是機器學習實例展示。本書內容系統、選材全面、知識講述詳細、易學易用，兼具實戰性和理論性，適合機器學習的初學者與進階者學習使用。

目錄大綱

第1部分機器學習的數學理論理解

第1講這個不確定的世界如何描述

1.1概率、幾率及期望

1.1.1概念及定義

1.1.2概率和幾率的關系

1.1.3期望值

1.2概率函數、概率分佈函數和概率密度函數

1.2.1隨機變量和普通變量的區別

1.2.2離散型隨機變量和連續型隨機變量

1.2.3離散型隨機變量概率函數

1.2.4離散型隨機變量概率分佈

1.2.5離散型隨機變量概率分佈函數

1.2.6連續型隨機變量的概率函數和分佈函數

1.3條件概率、聯合概率以及貝葉斯公式

1.3.1計算條件概率和聯合概率

1.3.2貝葉斯公式的歷史和現實含義

1.4本講小結

第2講數據的形態描述

2.1正態分佈

2.2混合高斯分佈

2.3伯努利分佈及二項分佈

2.4泊松分佈

2.5指數分佈

2.6冪律分佈

2.7以上分佈的總結和聯系

2.8本講小結

第3講信息的數學表達

3.1自信息

3.2信息熵

3.3信息增益

3.4相對熵

3.5交叉熵

3.6基尼指數(不純度)

3.7本講小結

第4講隨機變量的相關性和重要性

4.1數值型變量之間的相關性

4.1.1協方差

4.1.2皮爾遜相關系數

4.2類別型變量之間的相關性

4.2.1互信息

4.2.2卡方值

4.3證據權重和信息值

4.3.1證據權重

4.3.2信息值

4.4本講小結

第5講抓住主要矛盾——降維技術理論

5.1主成分分析

5.2線性判別分析

5.3奇異值分解

5.4自編碼器

5.5PCA、SVD和 AE 是親戚

5.6傅里葉變換

5.7本講小結

第6講採樣方法

6.1拒絕採樣

6.2馬爾可夫鏈蒙特卡羅採樣

6.3MetropolisHastings採樣

6.4吉布斯採樣

6.5湯普森採樣

6.6上採樣人工合成數據策略

6.7本講小結

第7講抬頭看路低頭拉車的迭代方法

7.1迭代求解

7.2梯度下降法

7.3牛頓法及其改進算法

7.3.1泰勒展開式

7.3.2牛頓法

7.4Adam(Adaptive Moment Estimation)方法

7.4.1動量法(Momentum)

7.4.2RMSProp 方法

7.4.3最終方法

7.5本講小結

第8講經典最優化問題求解方法

8.1最小二乘估計

8.2最大似然估計

8.3最大後驗概率

8.4期望最大化方法

8.5最大熵模型

8.6本講小結

第2部分機器學習模型、方法及本質

第9講機器學習的方法論

9.1總體方法論

9.1.1業務理解建模

9.1.2建立假設模型

9.1.3數據收集

9.1.4數據準備

9.1.5建模分析

9.1.6解釋和模型評估

9.2建模分析的一般步驟

9.3模型和算法

9.3.1按學習方法區分

9.3.2按任務維度區分

9.3.3按模型的類型分

9.3.4模型算法和維度的對應

9.4本講小結

第10講數據準備

10.1釐清數據來源

10.1.1先有模型還是先有數據

10.1.2數據來源的類型

10.2數據的探索性分析

10.2.1主要工作內容

10.2.2主要步驟

10.3本講小結

第11講異常檢測和處理

11.1什麽是異常值

11.2異常檢測面臨的挑戰

11.3異常的種類

11.4異常檢測的應用領域

11.5異常檢測的方法

11.5.1基於統計模型的異常檢測

11.5.2基於深度學習的異常檢測

11.6本講小結

第12講特徵數據的預處理

12.1特徵標準化

12.2連續變量離散化

12.2.1為什麽要離散化

12.2.2如何進行離散化

12.3離散型特徵處理

12.3.1數值化處理

12.3.2啞編碼

12.3.3時間序列處理

12.4本講小結

第13講特徵的選擇、提取和構造

13.1為什麽要進行特徵的選擇、提取和構造

13.1.1特徵數量和模型性能的關系

13.1.2特徵選擇、提取和構造的主要原因

13.1.3其他非技術因素

13.2特徵的選擇

13.2.1過濾策略

13.2.2包裹策略

13.2.3嵌入策略

13.2.4三種策略的總結

13.3特徵的提取和構造

13.3.1特徵投影(降維)

13.3.2特徵組合

13.4本講小結

第14講機器學習模型——邏輯回歸和梯度提升決策樹

14.1邏輯回歸

14.1.1Logit的引入

14.1.2參數的求解過程

14.1.3模型的使用

14.1.4模型的本質

14.2梯度提升決策樹

14.2.1梯度提升決策樹的含義

14.2.2梯度提升決策樹的實現過程

14.2.3梯度提升決策樹例子及分析

14.2.4XGBoost

第15講機器學習模型——概率圖模型

15.1概述

15.2概率圖模型族譜及特徵

15.2.1特徵一：有向和無向

15.2.2特徵二：馬爾可夫性質

15.2.3特徵三：判別式和生成式

15.2.4特徵四：序列型模型

15.2.5核心概念小結

15.3兩個典型的概率圖模型

15.3.1隱馬爾可夫模型

15.3.2條件隨機場(CRF)

第16講機器學習模型——強化學習

16.1ε貪婪算法

16.2置信區間上界算法

16.3湯普森採樣

16.3.1貝塔分佈

16.3.2貝塔分佈與二項式分佈的共軛先驗性質

16.3.3湯普森採樣的具體過程

16.4共性問題

第17講探索式學習

17.1概述

17.2模擬退火算法

17.3遺傳算法

17.4蟻群算法

第18講機器學習模型——人工神經網絡

18.1神經網絡的起源

18.2神經網絡的開端

18.2.1最簡單的神經網絡結構——感知機

18.2.2多層感知機

18.3神經網絡的崛起——反向傳播神經網絡

18.4神經網絡的突破——深度學習

18.4.1圖像識別的過程展示

18.4.2深度學習成功的關鍵

18.4.3深度學習的缺陷

18.5神經網絡的實質——通用逼近定理

第19講基於機器學習的推薦技術

19.1推薦的作用

19.2推薦採用的方法

19.2.1基於鄰域的推薦方法

19.2.2隱語義模型推薦方法

19.2.3利用標簽的推薦方法

19.2.4利用上下文信息推薦方法

19.2.5深度學習推薦方法

19.3推薦效果評測指標和維度

第20講激活函數

20.1激活函數的作用

20.2激活函數的要求

20.3常用激活函數介紹

20.3.1Sigmoid函數

20.3.2tanh函數

20.3.3ReLU函數

20.3.4LeakyReLU函數

20.3.5ELU函數

20.3.6softmax函數

20.3.7常用激活函數的選擇建議

20.3.8高斯函數

第21講代價函數

21.1損失函數、代價函數和目標函數

21.2經驗風險、期望風險和結構風險

21.3正則化的本質

21.4常用損失函數

21.4.1平均絕對誤差和均方誤差

21.4.2Huber損失

21.4.3對數損失

21.4.4對比損失/三元組損失(Triplet Loss)

21.5本講小結

第22講模型效果的衡量方法

22.1分類問題的模型效果衡量方法

22.1.1混淆矩陣

22.1.2FScore

22.1.3ROC及AUC

22.1.4KS值

22.2回歸模型中的效果衡量方法

22.3模型的選擇要素——偏差和方差

22.4交叉驗證

22.5本講小結

第23講機器學習和人工智能展望

23.1當前人工智能技術本質的認識

23.1.1人工智能和機器學習的關系

23.1.2信息技術產業鏈條

23.2第三代人工智能的發展方向

23.2.1第一代和第二代人工智能的歷史

23.2.2第三代人工智能要求

23.3人工智能的小數據、大任務範式

23.3.1一隻烏鴉給我們的啟示

23.3.2小數據、大任務範式

第3部分機器學習實例展示

第24講垃圾郵件判斷(樸素貝葉斯分類)

24.1問題描述

24.2算法詳述

24.3代碼詳述

第25講客戶流失預測(高斯貝葉斯分類)

25.1問題描述

25.2算法詳述

25.3代碼詳述

第26講兩個特殊硬幣的投擲概率(期望最大化方法)

26.1問題描述

26.2算法詳述

26.3代碼詳述

第27講信用卡申請評分卡模型(WOE/IV邏輯回歸)

27.1問題描述

27.2算法詳述

27.3代碼詳述

第28講用戶忠誠度變化軌跡預測(隱馬爾可夫模型)

28.1問題描述

28.2算法詳述

28.3代碼詳述

第29講產品的價格設定(強化學習)

29.1問題描述

29.2算法詳述

29.3代碼詳述

第30講數據智能平臺

30.1數據智能包含哪些內容

30.1.1基礎平臺

30.1.2融合平臺

30.1.3治理系統

30.1.4質量保證

30.1.5安全計算

30.1.6分析挖掘

30.1.7數據可視化

30.2產品化的數智平臺

30.3本講小結

大話機器學習 — 原理|算法|建模|代碼 30講

葉新江

買這商品的人也買了...

商品描述

目錄大綱

類似商品