可解釋機器學習:模型、方法與實踐

索信達控股 邵平 楊健穎 蘇思达 等

  • 出版商: 機械工業
  • 出版日期: 2022-01-01
  • 售價: $474
  • 貴賓價: 9.5$450
  • 語言: 簡體中文
  • 頁數: 232
  • 裝訂: 平裝
  • ISBN: 7111695712
  • ISBN-13: 9787111695714
  • 相關分類: Machine Learning 機器學習
  • 立即出貨 (庫存 < 4)

買這商品的人也買了...

商品描述

本書先從背景出發,
闡述黑盒模型存在的問題以及不解決黑盒問題模型可能帶來的後果,
引出可解釋機器學習的重要性;
隨後,我們從可解釋機器學習的研究方向,
分為內在可解釋模型算法和模型事後解析方法兩部分進行介紹,
闡述不同模型的原理、應用及其可解釋性。
z後通過三個不同的應用場景,介紹在銀行實戰中的數據挖掘方法,由問題、處理方法出發,
結合可解釋機器學習模型結果,證明模型的有效性和實用性,期望讀者通過對本書的閱讀,
可以更快更好的解決實際業務問題,而非紙上談兵。
業務場景均為業內的典型案例,希望能夠對讀者有所啟發。
同時,本書中還會有大量的公式與代碼,保證內容的豐富與嚴謹,
經得起推敲,使得讀者知其然且知其所以然。

作者簡介

邵平

資深數據科學家,索信達控股金融AI實驗室總監。
在大數據、人工智能領域有十多年技術研發和行業應用經驗。
技術方向涉及可解釋機器學習、深度學習、時間序列預測、智能推薦、自然語言處理等。
現主要致力於可解釋機器學習、推薦系統、銀行智能營銷和智能風控等領域的技術研究和項目實踐。

楊健穎

雲南財經大學統計學碩士,高級數據挖掘工程師,
一個對數據科學有堅定信念的追求者,目前重點研究機器學習模型的可解釋性。

蘇思达

美國天普大學統計學碩士,機器學習算法專家,
長期為銀行提供大數據與人工智能解決方案和技術服務。
主要研究方向為可解釋機器學習與人工智能,曾撰寫
《可解釋機器學習研究報告》和多篇可解釋機器學習相關文章。

目錄大綱

前言
第一部分 背景
第1章 引言2
1.1 可解釋機器學習研究背景2
1.1.1 機器學習面臨的挑戰2
1.1.2 黑盒模型存在的問題4
1.2 模型可解釋性的重要性8
1.3 國內外的模型監管政策10
1.4 本章小結11

第2章 可解釋機器學習12
2.1 模型的可解釋性12
2.1.1 可解釋性的定義13
2.1.2 可解釋性的分類14
2.1.3 可解釋機器學習的研究方向16
2.2 可解釋性的作用18
2.2.1 產生信任19
2.2.2 提供因果關係依據19
2.2.3 幫助模型診斷20
2.2.4 安全使用模型22
2.2.5 避免發生偏見與歧視22
2.3 可解釋性的實現23
2.3.1 建模前的可解釋性實現23
2.3.2 建模中的可解釋性實現26
2.3.3 建模後的可解釋性實現28
2.4 本章小結29

第二部分 理論
第3章 內在可解釋機器學習模型32
3.1 傳統統計模型33
3.1.1 線性回歸33
3.1.2 廣義線性模型37
3.1.3 廣義加性模型41
3.1.4 決策樹48
3.2 EBM模型52
3.2.1 模型定義52
3.2.2 識別二階交互項53
3.2.3 實現算法56
3.2.4 模型解釋性59
3.2.5 模型的優勢與不足62
3.3 GAMINet模型63
3.3.1 模型定義64
3.3.2 GAMINet的3個重要準則66
3.3.3 實現算法70
3.3.4 模型解釋性72
3.3.5 模型的優勢與不足77
3.4 RuleFit模型77
3.4.1 模型定義78
3.4.2 規則提取79
3.4.3 實現算法81
3.4.4 模型解釋性81
3.4.5 模型的優勢與不足84
3.5 Falling Rule Lists模型85
3.5.1 模型定義85
3.5.2 模型參數估計87
3.5.3 實現算法88
3.5.4 模型解釋性89
3.5.5 模型的優勢與不足90
3.6 GAMMLI模型91
3.6.1 傳統推薦算法的不足92
3.6.2 交互項效應擬合方法94
3.6.3 自適應軟填充95
3.6.4 模型解釋性97
3.6.5 模型的優勢與不足99
3.7 本章小結99

第4章 複雜模型事後解析方法101
4.1 部分依賴圖102
4.1.1 部分依賴函數102
4.1.2 估計方法103
4.1.3 部分依賴圖的局限105
4.1.4 個體條件期望圖106
4.1.5 實例演示107
4.2 累積局部效應圖111
4.2.1 從部分依賴圖到累積局部效應圖112
4.2.2 累積局部效應方程114
4.2.3 實例演示116
4.2.4 ALE方法的優劣118
4.3 LIME事後解析方法118
4.3.1 局部代理模型119
4.3.2 LIME方法的基本流程120
4.3.3 LIME方法的解釋121
4.3.4 LIME方法的優劣123
4.4 SHAP事後解析方法124
4.4.1 SHAP的基本思想125
4.4.2 Shapley Value126
4.4.3 SHAP的實現算法128
4.4.4 SHAP方法的解釋137
4.4.5 SHAP方法的優劣140
4.4.6 擴展閱讀141
4.5 本章小結143

第三部分 實例
第5章 銀行VIP客戶流失預警及歸因分析146
5.1 案例背景146
5.2 數據介紹147
5.3 建模分析148
5.3.1 目標定義148
5.3.2 數據處理149
5.3.3 模型構建150
5.3.4 流失歸因151
5.4 營銷建議157
5.5 代碼展示159
5.6 本章小結162

第6章 銀行個人客戶信用評分模型研究163
6.1 案例背景163
6.2 數據介紹164
6.3 建模分析165
6.3.1 目標定義165
6.3.2 數據處理166
6.3.3 模型構建167
6.4 三種方法對比180
6.5 代碼展示182
6.6 擴展思考:基於規則的特徵衍生186
6.7 本章小結188

第7章 銀行理財產品推薦建模分析189
7.1 場景介紹189
7.1.1 推薦系統190
7.1.2 銀行中的推薦系統193
7.2 數據介紹196
7.2.1 推薦場景數據特點196
7.2.2 Santander數據集197
7.3 建模分析199
7.3.1 數據處理199
7.3.2 模型構建200
7.3.3 模型結果評估204
7.4 案例分析208
7.5 本章小結211