Python 貝葉斯分析 Bayesian Analysis with Python

[阿根廷] Osvaldo Martin

買這商品的人也買了...

商品描述

《Python貝葉斯分析》從務實和編程的角度講解了貝葉斯統計中的主要概念,並介紹瞭如何使 用流行的 PyMC3 來構建概率模型。閱讀本書,讀者將掌握實現、檢查和擴展貝 葉斯統計模型,從而提升解決一系列數據分析問題的能力。本書不要求讀者有任 何統計學方面的基礎,但需要讀者有使用 Python 編程方面的經驗。

作者簡介

作者:[阿根廷] Osvaldo Martin(奧斯瓦爾多·馬丁)譯者:田俊

Osvaldo Martin是阿根廷國家科學與技術理事會(CONICET)的一名研究員。該理事會是負責阿根廷科技進步的主要組織。Osvaldo Martin曾從事結構生物信息學和計算生物學方面的研究,此外,他在應用馬爾科夫蒙特卡洛方法模擬分子方面有著豐富的經驗,尤其喜歡用Python解決數據分析問題。他曾講授結構生物信息學、Python編程等課程,還開設了貝葉斯數據分析的課程。Python和貝葉斯統計改變了他對科學的認知和對問題的思考方式。他寫本書的動力是希望藉助Python幫助大家理解概率模型,同時,他也是PyMOL社區(一個基於C/Python的分子可視化社區)的活躍成員,他也對PyMC3社區做了一些貢獻。

譯者簡介
田俊,計算機專業碩士。2016年畢業於中國科學院自動化研究所,主要研究方向為自然語言處理中的短文本分類,畢業後曾在滴滴出行擔任算法工程師,目前在微軟從事自然語言處理方面的工作。

中文版審校者簡介
勞俊鵬,心理學博士,PyMC團隊成員。2014年畢業於英國格拉斯哥大學,主要研究認知神經心理學。2013年至今在瑞士弗里堡大學從事心理學研究,專攻數據建模分析和神經計算模型。

目錄大綱

第1章概率思維——貝葉斯推斷指南1 
1.1以建模為中心的統計學1 
1.1.1探索式數據分析2 
1.1.2統計推斷3 
1.2概率與不確定性4 
1.2.1概率分佈6 
1.2.2貝葉斯定理與統計推斷9 
1.3單參數推斷11 
1.3.1拋硬幣問題11 
1.3.2報告貝葉斯分析結果20 
1.3.3模型註釋和可視化20 
1.3.4總結後驗21 
1.4後驗預測檢查24 
1.5安裝必要的Python庫24 
1.6總結25 
1.7練習25 

第2章概率編程——PyMC3編程指南27 
2.1概率編程27 
2.1.1推斷引擎28 
2.2 PyMC3介紹40 
2.2.1用計算的方法解決拋硬幣問題40 
2.3總結後驗47 
2.3.1基於後驗的決策48 
2.4總結50 
2.5深入閱讀50 
2.6練習51 

第3章多參和分層模型53 
3.1冗餘參數和邊緣概率分佈53 
3.2隨處可見的高斯分佈55 
3.2.1高斯推斷56
3.2.2魯棒推斷59 
3.3組間比較64 
3.3.1 “小費”數據集65 
3.3.2 Cohen's d 68 
3.3.3概率優勢69 
3.4分層模型69 
3.4.1收縮72 
3.5總結74 
3.6深入閱讀75 
3.7練習75 

第4章利用線性回歸模型理解並預測數據77 
4.1一元線性回歸77 
4.1.1與機器學習的聯繫78 
4.1.2線性回歸模型的核心78 
4.1.3線性模型與高自相關性83 
4.1 .4對後驗進行解釋和可視化86 
4.1.5皮爾遜相關係數89 
4.2魯棒線性回歸95 
4.3分層線性回歸98 
4.3.1相關性與因果性103 
4.4多項式回歸105 
4.4.1解釋多項式回歸的係數107 
4.4.2多項式回歸——終極模型?108 
4.5多元線性回歸108 
4.5.1混淆變量和多餘變量112 
4.5.2多重共線性或相關性太高115 
4.5.3隱藏的有效變量117 
4.5.4增加相互作用120 
4.6 glm模塊120 
4.7總結121
4.8深入閱讀121 
4.9練習122 

第5章利用邏輯回歸對結果進行分類123 
5.1邏輯回歸123 
5.1.1邏輯回歸模型125 
5.1.2鳶尾花數據集125 
5.1.3將邏輯回歸模型應用到鳶尾花數據集128 
5.2多元邏輯回歸131 
5.2.1決策邊界132 
5.2.2模型實現132 
5.2.3處理相關變量134 
5.2.4處理類別不平衡數據135 
5.2.5如何解決類別不平衡的問題137 
5.2.6解釋邏輯回歸的係數137 
5.2.7廣義線性模型138 
5.2.8 Softmax回歸或多項邏輯回歸139 
5.3判別式和生成式模型142 
5.4總結144 
5.5深入閱讀145 
5.6練習145 

第6章模型比較147 
6.1奧卡姆剃刀——簡約性與準確性147 
6.1.1參數太多導致過擬合149 
6.1.2參數太少導致欠擬合150 
6.1.3簡潔性與準確性之間的平衡151 
6.2正則先驗152 
6.2 .1正則先驗和多層模型153 
6.3衡量預測準確性153 
6.3.1交叉驗證154
6.3.2信息量準則155 
6.3.3用PyMC3計算信息量準則158 
6.3.4解釋和使用信息校準162 
6.3.5後驗預測檢查163 
6.4貝葉斯因子164 
6.4.1類比信息量準則166 
6.4. 2計算貝葉斯因子166 
6.5貝葉斯因子與信息量準則169 
6.6總結171 
6.7深入閱讀171 
6.8練習171 

第7章混合模型173 
7.1混合模型173 
7.1.1如何構建混合模型174 
7.1.2邊緣高斯混合模型180 
7.1.3混合模型與計數類型變量181 
7.1.4魯棒邏輯回歸187 
7.2基於模型的聚類190 
7.2.1固定成分聚類191 
7.2.2非固定成分聚類191 
7.3連續混合模型192 
7.3.1 beta-二項分佈與負二項分佈192 
7.3.2 t分佈193 
7.4總結193 
7.5深入閱讀194 
7.6練習194 

第8章高斯過程195 
8.1非參統計195 
8.2基於核函數的模型196 
8.2. 1高斯核函數196
8.2.2核線性回歸197 
8.2.3過擬合與先驗202 
8.3高斯過程202 
8.3.1構建協方差矩陣203 
8.3.2根據高斯過程做預測207 
8.3.3用PyMC3實現高斯過程211 
8.4總結215 
8.5深入閱讀216 
8.6練習216