豆包統計分析與可視化從入門到通
張良康
- 出版商: 北京大學
- 出版日期: 2026-05-01
- 售價: $594
- 語言: 簡體中文
- 頁數: 412
- ISBN: 7301373791
- ISBN-13: 9787301373798
-
相關分類:
Data-visualization
下單後立即進貨 (約4週~6週)
商品描述
本書系統介紹如何借助豆大模型開展統計分析與可視化工作,兼顧理論講解與實戰作,內容翔實且具有較強實用性。全書共13章,涵蓋從數據獲取、預處理到各類統計分析、可視化呈現,再到實際應用系統搭建的完整流程。具體而言,書中先對豆大模型進行概述,括其在統計分析與可視化中的勢及使用入門方法;隨後詳細講解利用豆獲取虛擬數據、編寫爬蟲腳本、存數據的方法,以及數據清洗、轉換與整合等預處理作;接著闡述如何使用豆繪制多種常見統計圖,實現描述性統計分析、探索性數據分析、征提取,還涉及推論統計、回歸分析、方差分析、非參數檢驗、主成分分析、聚類分析、生存分析、因子分析等多種統計方法,同時介紹了機器學習與統計分析的結合,以及基於豆實現黃金格預測系統的搭建方法。
本書搭配豐富的實案例與代碼示例,以“豆大模型+統計分析與可視化”為核心主線構建知識體系,適合統計分析初、數據從業人員、相關業學生等閱讀,以助力讀者快速掌握利用豆大模型進行統計分析與可視化的技能,為開展數據分析工作提供有力支持。
目錄大綱
第1章
豆大模型介紹
1.1 豆大模型概述2
1.1.1 豆大模型的概念與點2
1.1.2 豆大模型的發展歷程3
1.2 豆大模型在統計分析與可視化中的勢4
1.2.1 高效的數據處理4
1.2.2 強大的分析功能集成5
1.2.3 直觀的可視化效果呈現6
1.3 豆大模型的使用初體驗8
1.3.1 註冊賬號8
1.3.2 安裝軟件9
1.3.3 開始使用11
1.4 豆的“數據分析”技能12
第2章
利用豆獲取數據
2.1 利用豆生成虛擬數據16
2.1.1 明確數據需求與格式16
2.1.2 生成數據的示例模板17
2.1.3 利用批量處理功能生成數據19
2.2 利用豆編寫爬蟲腳本20
2.2.1 編寫爬蟲腳本20
2.2.2 抓取百度熱搜信息21
2.2.3 抓取北京大學出版社網頁的新聞信息24
2.3 利用豆存數據30
2.3.1 存為CSV格式30
2.3.2 存為Excel格式33
第3章
利用豆實現數據預處理
3.1 使用豆實現數據清洗39
3.1.1 缺失值處理39
3.1.2 異常值檢測與處理46
3.1.3 數據清洗實案例52
3.2 使用豆實現數據轉換與整合53
3.2.1 數據類型轉換54
3.2.2 數據標準化與歸一化58
第4章
使用豆繪制可視化統計圖
4.1 使用豆繪制常用的圖表65
4.1.1 柱狀圖、折線圖和餅圖65
4.1.2 散點圖、箱線圖和熱力圖75
4.2 足球運動員的可視化分析實戰88
4.2.1 基本數據分析88
4.2.2 簡數據90
4.2.3 數據概覽分析91
4.2.4 身高球員的柱狀圖91
4.2.5 繪制球員年齡的散點分布圖93
4.2.6 綜合可視化圖表94
第5章
使用豆實現描述性統計分析
5.1 使用豆實現集中趨勢度量99
5.1.1 均值計算與分析99
5.1.2 中位數與分位數計算106
5.1.3 眾數識別117
5.2 使用豆實現離散程度度量124
5.2.1 差與四分位差計算124
5.2.2 方差與標準差分析132
5.2.3 變異系數應用137
5.2.4 異常值檢測方法141
第6章
使用豆實現探索性數據分析
6.1 使用豆實現數據分布探索149
6.1.1 概率分布擬合與檢驗149
6.1.2 數據分布可視化方法155
6.2 使用豆實現變量間關系探索160
6.2.1 相關性分析方法160
6.2.2 變量關系可視化展示165
第7章
使用豆提取征
7.1 使用豆實現征工程173
7.1.1 數值型征處理173
7.1.2 類別型征編碼181
7.1.3 時間征構造188
7.1.4 征組合與派生193
7.2 使用豆實現征降維200
7.2.1 線性降維技術200
7.2.2 非線性降維技術205
7.2.3 征選擇式降維209
第8章
使用豆實現推論統計和回歸分析
8.1 使用豆實現推論統計216
8.1.1 抽樣分布與參數估計216
8.1.2 假設檢驗222
8.2 使用豆實現回歸分析228
8.2.1 線性回歸分析228
8.2.2 非線性回歸分析233
第9章
使用豆實現方差分析和非參數檢驗
9.1 使用豆實現方差分析240
9.1.1 單因素方差分析240
9.1.2 多因素方差分析244
9.2 使用豆實現非參數統計分析248
9.2.1 單樣本非參數檢驗249
9.2.2 兩獨立樣本非參數檢驗253
9.2.3 多獨立樣本非參數檢驗258
第10章
使用豆實現主成分分析和聚類分析
10.1 使用豆實現主成分分析271
10.1.1 數據標準化與協方差矩陣計算271
10.1.2 征值分解與主成分提取282
10.1.3 主成分得分計算與結果解釋289
10.2 使用豆實現聚類分析295
10.2.1 使用豆實現K-Means聚類算法295
10.2.2 使用豆實現層次聚類分析300
第11章
使用豆實現生存分析和因子分析
11.1 使用豆實現生存分析307
11.1.1 使用豆實現Kaplan-Meier估計307
11.1.2 使用豆實現Cox比例風險模型312
11.2 使用豆實現因子分析316
11.2.1 數據適用性檢驗316
11.2.2 因子提取與旋轉方法選擇321
第12章
機器學習與統計分析
12.1 使用豆實現線性判別分析329
12.2 使用豆實現機器學習中的統計
方法333
12.2.1 使用豆實現回歸分析333
12.2.2 使用豆實現貝葉斯方法337
12.2.3 使用豆實現統計假設檢驗341
12.2.4 使用豆實現概率圖模型345
第13章
基於豆實現黃金格預測系統
13.1 系統介紹 350
13.2 基於機器學習的黃金格預測系統 ?????351
13.2.1 需求分析351
13.2.2 數據預處理 354
13.2.3 創建機器學習模型361
13.2.4 創建交易策略 370
13.3 基於深度學習的金預測模型375
13.3.1 準備數據378
13.3.2 使用MLP經網絡進行預測 384
13.3.3 創建MLP模型 389
13.3.4 MLP模型化393
