Python 金融數據挖掘與分析實戰

劉鵬,高中強

  • 出版商: 機械工業
  • 出版日期: 2021-12-01
  • 定價: $654
  • 售價: 8.5$556
  • 語言: 簡體中文
  • 頁數: 416
  • 裝訂: 平裝
  • ISBN: 7111696506
  • ISBN-13: 9787111696506
  • 相關分類: Python程式語言Data Science
  • 立即出貨

買這商品的人也買了...

商品描述

內容簡介
這是一本金融數據挖掘與分析領域的實戰性著作,
它能指導零Python編程基礎和零數據挖掘與分析基礎的讀者快速掌握金融數據挖掘與分析的工具、技術和方法。
讀完本書,你將會有如下3個方面的收穫:
(1)Python編程基礎和數據預處理首先詳細講解了Python的核心語法,
以及NumPy、Matplotlib、PySpark、Jupyter Notebook等Python數據處理工具的使用;
然後詳細介紹了數據預處理的流程和技巧。
通過深入淺出的語言和豐富的樣例展示,
幫助初學者快速上手 Python,為之後的數據分析實戰夯實基礎。
(2)數據挖掘與分析的經典方法詳細講解了經典的數據挖掘方法,
包括聚類分析、回歸分析、分類分析、異常檢測、關聯分析、時間序列分析等。
(3)主要金融應用場景的數據挖掘方法

作者簡介

作者介紹
劉鵬
教授,清華大學博士,雲計算、大數據和人工智能領域的知名專家,南京云創大數據科技股份有限公司總裁、中國大數據應用聯盟人工智能專家委員會主任。
中國電子學會雲計算專家委員會雲存儲組組長、工業和信息化部雲計算研究中心專家。中國信息協會教育分會人工智能教育專家委員會主任、教育部全國普通高校畢業生就業創業指導委員會委員、“2019年全國大學生數學建模比賽”命題人、“第45屆世界技能大賽”中國區雲計算選拔賽裁判長/專家指導組組長、2002 PennySort國際計算機排序比賽冠軍與2003年全國挑戰杯總冠軍。提出的反垃圾郵件網格,被IEEE Cluster 2003評為傑出網格項目,為解決困擾全球的垃圾郵件問題做出根本貢獻,該技術成為雲安全技術的基礎。


高中強
人工智能與大數據領域技術專家,有非常深厚的積累,擅長機器學習和自然語言處理,尤其是深度學習,熟悉Tensorflow、PyTorch等深度學習開發框架。
曾獲“2019年全國大學生數學建模優秀命題人獎”。參與鍾南山院士指導新型冠狀病毒人工智能預測系統研發項目,與鍾南山院士團隊共同發表學術論文《Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions》。合著有參《人工智能:從小白到大神》、《人工智能數學基礎》等著作。

目錄大綱

 前 言
第1章 Python工作環境準備 1
1.1 Anaconda環境安裝 1
1.2 常用Python 交互工具 4
1.3 Jupyter Notebook簡介 6
1.4 習題 9
第2章 Python入門 10
2.1 Python基礎知識 10
2.2 Python基礎語法 11
2.3 Python變量類型 15
2.4 Python運算符 20
2.4.1 算術運算符 20
2.4.2 比較運算符 22
2.4.3 賦值運算符 23
2.4.4 按位運算符 24
2.4.5 邏輯運算符 25
2.4.6 成員運算符 26
2.4.7 身份運算符 27
2.4.8 運算符優先級 28
2.5 Python條件與循環語句 29
2.5.1 條件語句 29
2.5.2 循環語句 31
2.6 Python函數 38
2.7 Python模塊 43
2.8 Python 文件處理 46
2.9 Python異常 48
2.10 數據分析相關庫 50
2.10.1 NumPy 50
2.10.2 Matplotlib 51
2.10.3 PySpark 53
2.10.4 其他常用庫 54
2.11 習題 55
第3章 數據預處理 56
3.1 數據分析工作流程 56
3.2 數據預處理 58
3.2.1 數據集導入 59
3.2.2 數據概覽 60
3.2.3 數據清洗 61
3.2.4 類別變量轉換 66
3.2.5 數據分割 67
3.2.6 特徵縮放 68
3.3 鳥瞰機器學習 71
3.4 習題 72
第4章 數據挖掘方法 74
4.1 分類分析 74
4.1.1 決策樹 75
4.1.2 支持向量機 75
4.1.3 分類算法的選擇 76
4.2 聚類分析 76
4.2.1 K均值算法 77
4.2.2 聚類算法和分類算法的區別 78
4.3 回歸分析 78
4.3.1 變量間的關係 79
4.3.2 回歸分析算法的分類和步驟 79
4.3.3 回歸分析算法的選擇 81
4.4 關聯分析 81
4.4.1 關聯規則 82
4.4.2 關聯規則的序列模式 82
4.5 時間序列分析 83
4.5.1 時間序列分析方法和步驟 83
4.5.2 時間序列的三種預測模式 85
4.6 異常檢測 85
4.7 推薦算法 86
4.8 習題 89
第5章 網絡輿情採集與熱點分析 90
5.1 網絡輿情概述 90
5.1.1 大數據網絡輿情背景 90
5.1.2 輿情處理過程 91
5.2 輿情數據採集 94
5.2.1 網絡輿情採集工具 95
5.2.2 網絡輿情數據爬取實例 100
5.3 實戰:微博熱點話題聚類 104
5.4 習題 110
第6章 輿情研判之情感分類 112
6.1 情感分析介紹 112
6.1.1 情感分析分類 112
6.1.2 情感分析文本預處理 114
6.1.3 實戰:中文文本處理練習 115
6.2 情感分類方法 118
6.2.1 基於詞典的情感分類 118
6.2.2 基於機器學習的情感分類 121
6.2.3 基於深度學習模型的情感分類 122
6.3 情感分類實戰演練 131
6.3.1 淘寶家電商品評論情感分類預測 131
6.3.2 京東客戶評論情感傾向預測 134
6.4 習題 140
第7章 用機器學習方法預測股價 142
7.1 股市數據分析價值 142
7.1.1 案例背景 142
7.1.2 案例價值 143
7.2 ARIMA模型 144
7.3 實戰:基於SVM和ARIMA的股價預測 145
7.4 習題 156
第8章 用人工智能方法預測股價 157
8.1 神經網絡預測方法 157
8.1.1 門控循環單元 158
8.1.2 VADER情感分析 158
8.2 實戰:基於LSTM和GRU的股價預測 159
8.3 實戰:股票市場新聞情感分析 165
8.4 習題 172
第9章 個人信用評分 173
9.1 個人信用評分概述 173
9.1.1 需求背景 174
9.1.2 國內外發展狀況 175
9.2 信用評分的技術與方法 176
9.2.1 信用評分的簡要歷史 176
9.2.2 信用評分的主要模型與方法 176
9.3 信用評分卡模型 180
9.3.1 模型介紹 180
9.3.2 數據分箱 180
9.3.3 WOE值 182
9.3.4 IV值 183
9.3.5 邏輯回歸算法原理 185
9.3.6 模型評價指標 186
9.3.7 建立信用評分卡 190
9.4 實戰:信用評分卡 190
9.4.1 讀取數據 191
9.4.2 數據預處理 191
9.4.3 探索性分析 197
9.4.4 模型分析 204
9.4.5 建立信用評分卡 208
9.5 習題 211
第10章 個人信用等級評估 213
10.1 概述 213
10.2 個人信用等級評估方法 215
10.2.1 決策樹 215
10.2.2 隨機森林 221
10.2.3 XGBoost簡介 224
10.2.4 多重共線性 228
10.2.5 數據重採樣 229
10.3 實戰:個人信用等級評估 232
10.3.1 導入相應包並讀取數據 232
10.3.2 查看數據情況 234
10.3.3 數據預處理及相關函數構建 241
10.3.4 模型訓練 244
10.3.5 預測並生成結果 251
10.4 習題 253
第11章 企業信用評估 255
11.1 企業信用評估概述 255
11.2 企業信用評估的技術與方法 257
11.2.1 支持向量機 257
11.2.2 樸素貝葉斯 259
11.2.3