統計計算與智能分析理論及其Python實踐

燕雪峰,張德平

買這商品的人也買了...

商品描述

本書介紹統計計算與智能分析基礎理論以及基於Python的模型算法實現。全書由13章組成,主要內容有:隨機數生成技術;數據探索性分析;特徵提取與選擇方法;最大期望算法;Markov鏈蒙特卡羅方法;重採樣技術;重要採樣技術;序貫重要性採樣;非參數概率密度估計;非參數回歸分析;樹模型理論;概率圖模型;模型性能評價技術。

目錄大綱

第1章隨機數生成技術..............................................................1

1.1標準分佈的隨機數生成....................................................... 1

1.1.1連續型隨機變量仿真生成...................................................2

1.1.2離散型隨機變量仿真生成..................................................10

1.2非標準分佈的隨機數生成................................................... 14

1.2.1逆變換法............................................................... 14

1.2.2接受-拒絕法與自適應拒絕法............................................... 16

1.2.3組合法................................................................. 22

1.3隨機過程的隨機數生成......................................................26

1.3.1馬爾可夫過程仿真生成....................................................27

1.3.2泊松過程仿真生成....................................................... 31

1.3.3維納過程仿真生成....................................................... 35

1.4基於變分自編碼器模型的數據生成.......................................... 36

1.4.1 VAE模型基本思想.......................................................37

1.4.2變分自編碼器模型....................................................... 37

1.5基於生成式對抗網絡的數據生成.............................................46

1.5.1 GANs的基本原理....................................................... 46

1.5.2 GANs理論推導......................................................... 48

1.5.3 GANs算法的近優算法................................................... 53

1.6習題........................................................................ 57

第2章探索性數據分析............................................................ 61

2.1一維探索性數據分析........................................................ 61

2.1.1匯總統計量............................................................. 62

2.1.2直方圖................................................................. 65

2.1.3莖葉圖................................................................. 66

2.1.4箱線圖................................................................. 68

2.1.5正態概率圖............................................................. 70

2.1.6 QQ圖.................................................................72

2.2多維探索性數據分析........................................................ 75

2.2.1多屬性統計量........................................................... 75

2.2.2散點圖................................................................. 77

2.2.3邊緣直方圖............................................................. 83

2.2.4邊緣箱形圖............................................................. 84

2.2.5成對圖................................................................. 86

2.2.6 Box-Cox線性變換圖..................................................... 87

2.2.7自相關圖和偏自相關圖....................................................90

2.2.8交叉相關圖.............................................................94

2.2.9滯後圖................................................................. 95

2.3習題........................................................................ 97

第3章特徵提取與選擇方法.......................................................100

3.1特徵提取方法..............................................................100

3.1.1主成分分析............................................................ 100

3.1.2因子分析.............................................................. 109

3.1.3獨立分量分析.......................................................... 115

3.1.4線性判別分析.......................................................... 125

3.2時間序列的特徵提取方法.................................................. 130

3.2.1 STL分解算法..........................................................130

3.2.2經驗模態分解.......................................................... 132

3.2.3奇異譜分析方法........................................................ 139

3.2.4小波變換.............................................................. 143

3.3特徵選擇方法..............................................................160

3.3.1過濾特徵選擇.......................................................... 161

3.3.2 Wrapper法............................................................163

3.3.3 Embedded法.......................................................... 166

3.3.4貝葉斯統計和正則化.................................................... 168

3.4習題.......................................................................173

第4章期望算法..............................................................176

4.1從極大似然估計到EM算法............................................... 176

4.2 EM算法原理與實現....................................................... 178

4.2.1 EM算法原理.......................................................... 178

4.2.2 EM算法.............................................................. 180

4.3 EM算法應用.............................................................. 184

4.3.1 K-Means聚類算法......................................................184

4.3.2高斯混合模型聚類算法.................................................. 187

4.3.3 K-Means和GMM的關係............................................... 195

4.4習題.......................................................................195

第5章馬爾可夫鏈蒙特卡羅方法.................................................. 197

5.1蒙特卡羅方法引入......................................................... 197

5.2馬爾可夫鏈蒙特卡羅方法.................................................. 198

5.3 Metropolis-Hastings採樣.................................................. 200

5.3.1 Metropolis採樣算法.................................................... 200

5.3.2 Metropolis-Hastings採樣算法............................................ 204

5.3.3多維Metropolis-Hastings採樣算法....................................... 207

5.4 Gibbs採樣................................................................ 209

5.5馬爾可夫鏈蒙特卡羅方法應用..............................................213

5.5.1基於MCMC的貝葉斯統計推斷...........................................213

5.5.2可逆跳轉MCMC方法.................................................. 215

5.6習題.......................................................................220

第6章重採樣技術................................................................222

6.1刀切法.....................................................................222

6.1.1刀切法基本原理........................................................ 222

6.1.2刀切法算法與實現...................................................... 225

6.2自助法.....................................................................225

6.2.1自助法基本原理........................................................ 225

6.2.2 Rn的統計特性......................................................... 229

6.3重採樣技術的應用......................................................... 230

6.3.1 Bagging算法.......................................................... 230

6.3.2 Boosting算法..........................................................237