金融商業算法建模:基於Python和SAS

趙仁乾,田建中,葉本華,常國珍 著

  • 出版商: 機械工業
  • 出版日期: 2021-11-01
  • 定價: $654
  • 售價: 7.9$517
  • 語言: 簡體中文
  • 頁數: 416
  • 裝訂: 平裝
  • ISBN: 7111692772
  • ISBN-13: 9787111692775
  • 立即出貨

買這商品的人也買了...

商品描述

這是一本貫穿金融業務經營全流程,以業務為驅動的金融數據挖掘與建模著作,
涵蓋分析框架、模型算法、模型評估、模型監控、算法工程化等整個數據建模的閉環。
本書的4位作者都是在金融領域有有多年工作經驗的大數據專家,不僅技術功底深厚、業務經驗豐富,
而且對金融行業從業者的需求痛點和圖書市場的供給情況有深入了解,他們通過精心策劃和寫作,
讓本書內容獨樹一幟:涵蓋金融業務經營全流程,全部以業務驅動,包含大量針對具體場景的實戰案例。
本書針對決策類、識別類、優化分析類3大主題,9大模板:
客戶價值預測、營銷響應預測、細分畫像、交叉銷售、申請反欺詐、違規行為識別、
預測、運籌優化、流程挖掘,詳細講解了每個模板算法原理、評估方法、
優化方法和應用案例等,內容上極力做到準確、明晰、直觀與實用。
此外,本書還對數據科學項目中比較容易被忽視的內容做了補充,
包括模型評估、模型監控、算法工程化,能指導讀者構建易讀、高效、健壯的數據科學工程。
本書堅持理論與實踐相結合,通過圖形、示例、公式幫助讀者快速掌握算法與優化理論的同時,
還打造了一套可輕鬆適配各種分析場景與需求的工具模板,力圖幫助讀者從理論快速跨越到實踐。

作者簡介

趙仁乾
現就職於某知名500強外資企業的創新實驗室,從事數據治理、數據平台開發、AI應用等工作,研究方向包括數字化運營、知識圖譜等。


田建中
現就職於某大型商業銀行大數據管理部,對數據挖掘在營銷中的應用有深入研究。


葉本華
現某諮詢公司大數據總監,主要從事企業級數據治理、數據倉庫(大數據平台)建設、數據中台以及數據智能應用場景和模型設計相關工作。


常國珍
曾任畢馬威諮詢大數據總監,擁有近20年數據挖掘、精益數據治理、數字化運營諮詢經驗,是金融信用風險、反欺詐和反洗錢算法領域的專家。

目錄大綱

前言
第1章 金融建模綜述1
1.1 企業中數據分析的層級1
1.2 操作層面的數據分析對象與成果4
1.3 數據挖掘方法分類介紹4
1.3.1 預測性—有監督學習5
1.3.2 描述性—無監督學習10
1.4 數據挖掘方法論12
1.5 數據挖掘建模框架的3個原則14
1.6 利用SAS EM創建數據挖掘項目16
1.6.1 創建數據挖掘項目16
1.6.2 給項目添加邏輯庫和數據集20
1.6.3 SAS EM項目的系統文檔介紹26

第2章 決策類模型28
2.1 客戶價值預測28
2.1.1 線性回歸模型概述28
2.1.2 Python案例:線性回歸建模33
2.1.3 多元線性回歸的變量篩選40
2.1.4 Python案例:多元線性回歸變量篩選43
2.1.5 模型假設檢驗44
2.1.6 殘差分析48
2.1.7 強影響點分析49
2.1.8 Python案例:線性回歸調優實戰50
2.1.9 線性回歸的完整流程小結59
2.1.10 正則化61
2.1.11 Python案例:嶺回歸與Lasso回歸實戰65
2.2 營銷響應預測70
2.2.1 使用邏輯回歸預測用戶響應率70
2.2.2 比較邏輯回歸與線性回歸70
2.2.3 圖解邏輯回歸71
2.2.4 邏輯回歸算法概述73
2.2.5 分類模型的評估75
2.2.6 分類變量的處理79
2.2.7 Python案例:邏輯回歸建模實戰80
2.2.8 SAS EM案例:貸款違約預測實戰88
2.2.9 邏輯回歸建模小結104
2.3 細分畫像104
2.3.1 主成分分析105
2.3.2 因子分析116
2.3.3 變量聚類127
2.3.4 樣本聚類1—層次聚類130
2.3.5 樣本聚類2—K-Means聚類136
2.4 交叉銷售165
2.4.1 關聯規則165
2.4.2 序列模式185

第3章 識別類模型195
3.1 申請反欺詐195
3.1.1 決策樹195
3.1.2 組合算法228
3.1.3 最近鄰域法253
3.1.4 樸素貝葉斯257
3.1.5 支持向量機263
3.1.6 神經網絡276
3.2 違規行為識別294
3.2.1 孤立森林296
3.2.2 局部異常因子304

第4章 優化分析類模型308
4.1 預測技術308
4.1.1 效應分解法309
4.1.2 基於動力模型的ARIMA317
4.1.3 基於深度學習的LSTM333
4.2 運籌優化341
4.2.1 線性規劃342
4.2.2 整數規劃344
4.2.3 非線性規劃347
4.3 流程挖掘348
4.3.1 業務流程挖掘的總體理念348
4.3.2 流程發現352
4.3.3 流程監控353
4.3.4 流程遵循354
4.3.5 Python案例:利用pm4py實現流程挖掘355

第5章 模型評估與模型監控363
5.1 模型評估363
5.1.1 混淆矩陣363
5.1.2 ROC曲線363
5.1.3 KS統計量365
5.1.4 洛倫茲曲線與基尼係數366
5.2 模型監控368
5.2.1 前端監控—業務指標368
5.2.2 前端監控—評分分佈穩定性368
5.2.3 前端監控—特徵分佈穩定性370
5.2.4 後端監控—評分正確性371
5.2.5 後端監控—變量有效性372

第6章 算法工程化374
6.1 構建合理的項目工程結構374
6.1.1 為什麼要構建合理的項目工程結構374
6.1.2 什麼是一個數據科學項目應有的結構375
6.2 如何編寫規範的數據工程代碼378
6.2.1 代碼可讀性379
6.2.2 數據處理性能381
附錄 SAS EM節點說明386