基於 Python 的交互式數據可視化編程 (Interactive Data Visualization with Python)

Abha Belorkar , Sharath Chandra Guntuku , Shubhangi Hora , Anshu Kumar 譯 林琪

買這商品的人也買了...

商品描述

你將學習以下內容:

• 探索和應用不同的交互式數據可視化技術。

• 管理圖參數和風格來創建吸引人的圖。

• 為不同觀眾定制數據可視化。

• 使用交互式庫設計數據可視化。

• 使用Matplotlib、Seaborn、Altair和Bokeh庫繪製吸引人的圖。

• 為不同場景定制數據可視化。

作者簡介

Abha Belorkar

是計算機科學領域的一位教育工作者和研究人員。
她在印度彼拉尼的博拉理工學院獲得計算機科學學士學位,並在新加坡國立大學獲得博士學位。
目前她的研究工作包括開發基於統計學、機器學習和數據可視化技術的方法,
研究神經退行性疾​​病的異構基因組數據。


Sharath Chandra Guntuku

是自然語言處理和多媒體計算領域的一位研究人員。
他在印度彼拉尼的博拉理工學院獲得計算機科學學士學位,在新加坡南洋理工大學獲得博士學位。
他的研究目標是利用大規模的社交媒體圖片和文本數據來模擬社會健康水平和心理特徵。
他使用機器學習、統計分析、
自然語言處理和計算機視覺來回答有關個人和社區健康和心理的問題。

 

Shubhangi Hora

是一位Python開發人員、人工智能愛好者、數據科學家和作者。
她擁有計算機科學和心理學背景,尤其熱衷於心理健康相關的人工智能。
除此之外,她還對錶演藝術感興趣,是一名訓練有素的音樂家。

 

Anshu Kumar

是一位數據科學家,在解決自然語言處理和推薦系統中的複雜問題方面有超過5年的經驗。
他擁有印度理工學院馬德拉斯分校計算機科學專業工學碩士學位。
他也是SpringBoard項目的導師。
他目前的興趣是為大規模多語言數據集實現語義搜索、文本摘要和內容推薦。

目錄大綱

目錄
前言
第1章Python可視化介紹:基礎和定制繪圖1
1.1本章介紹1
1.2使用pandasDataFrame處理數據2
1.2.1從文件讀取數據2
1.2.2練習1:從文件讀取數據2
1.2.3觀察和描述數據3
1.2.4練習2:觀察和描述數據3
1.2.5從DataFrame選擇列6
1.2.6為DataFrame增加新列6
1.2.7練習3:為DataFrame增加新列6
1.2.8在DataFrame列上應用函數8
1.2.9練習4:在DataFrame列上應用函數8
1.2.10練習5:對多列應用函數11
1.2.11從DataFrame刪除列12
1.2.12練習6:從DataFrame刪除列12
1.2.13將DataFrame寫至文件13
1.2.14練習7:將DataFrame寫至文件13
1.3使用pandas和seaborn繪圖15
1.3.1創建簡單圖可視化顯示變量分佈15
1.3.2直方圖15
1.3.3練習8:繪製和分析直方圖15
1.3.4柱狀圖18
1.3.5練習9:創建柱狀圖併計算平均價格分佈18
1.3.6練習10:創建按一個特定特徵分組的柱狀圖21
1.4調整繪圖參數21
1.4.1練習11:調整分組柱狀圖的繪圖參數21
1.4.2標註23
1.4.3練習12:標註一個柱狀圖23
1.4.4實踐活動1:分析不同場景並生成適當的可視化25
1.5小結29

第2章靜態可視化:全局模式和匯總統計31
2.1本章介紹31
2.2繪圖表示數據中的全局模式31
2.2.1散點圖32
2.2.2練習13:創建一個靜態散點圖33
2.2.3六邊形圖33
2.2.4練習14:創建一個靜態六邊形圖33
2.2.5等高線圖34
2.2.6練習15 :創建靜態等高線圖34
2.2.7折線圖35
2.2.8練習16:創建一個靜態折線圖36
2.2.9練習17:用多個折線圖表示數據隨時間的變化37
2.2.10熱圖39
2.2.11練習18:創建和探索一個靜態熱圖39
2.2.12熱圖中連鎖的概念43
2.2.13練習19:在靜態熱圖中創建連鎖43
2.3繪圖表示數據的匯總統計46
2.3.1再談直方圖46
2.3.2示例1:再談直方圖46
2.3.3箱形圖47
2.3.4練習20:創建和探索靜態箱形圖47
2.3.5小提琴圖49
2.3.6練習21:創建一個靜態小提琴圖49
2.3.7實踐活動2:設計靜態可視化表示全局模式和匯總統計51
2.4小結53

第3章從靜態到交互式可視化54
3.1本章介紹54
3.2靜態與交互式可視化55
3.3交互式數據可視化的應用58
3.4交互式數據可視化入門60
3.4.1使用Bokeh創建交互式數據可視化61
3.4.2練習22:準備數據集62
3.4.3練習23:為交互式數據可視化創建基本靜態圖65
3.4.4練習24:為這個靜態圖增加一個滑動條67
3.4.5練習25:增加一個懸停提示工具69
3.4.6使用PlotlyExpress創建交互式數據可視化72
3.4.7練習26:創建一個交互式散點圖72
3.4.8實踐活動3:使用PlotlyExpress創建不同的交互式可視化76
3.5小結78

第4章基於層次的數據交互式可視化79
4.1本章介紹79
4.2交互式散點圖80
4.2.1練習27:為靜態散點圖增加放大縮小功能81
4.2.2練習28:為散點圖增加懸停和工具提示功能84
4.2.3練習29:探索散點圖上的選擇和突出顯示功能86
4.2.4練習30:生成一個提供選擇、縮放和懸停/工具提示功能的圖88
4.2.5跨多圖選擇91
4.2.6練習31:跨多圖選擇92
4.2.7基於特徵值的選擇94
4.2.8練習32:基於特徵值的選擇95
4.3 altair中的其他交互式圖98
4.3.1練習33:在靜態柱狀圖上增加縮放特性併計算均值98
4.3.2練習34:在柱狀圖上表示均值的一個替代快捷方式102
4.3.3練習35:在靜態熱圖上增加縮放特性105
4.3.4練習36:創建相鄰的柱狀圖和熱圖107
4.3.5練習37:動態鏈接一個柱狀圖和一個熱圖110
4.3.6實踐活動4:生成一個柱狀圖和一個熱圖表示GooglePlayStoreApps數據集中的內容分級類型113
4.4小結115

第5章基於時間的數據交互式可視化116
5.1本章介紹116
5.2時態數據117
5.3時態數據類型117
5.3.1為什麼研究時態數據可視化? 118
5.4理解時態數據和時間序列數據的關係119
5.5使用時態數據的領域示例120
5.6時態數據可視化120
5.6.1如何管理和可視化時間序列數據123
5.6.2 pandas中的日期/時間處理124
5.6.3建立一個Datetime索引125
5.7為時態數據選擇正確的聚合等級126
5.7.1練習38:創建一個靜態柱狀圖併計算時態數據的均值和標準差127
5.7.2練習39:計算zscore查找時態數據中的異常值130
5.8時態數據中的重採樣133
5.8.1上採樣和下採樣的常見問題134
5.8.2練習40:時態數據的上採樣和下採樣134
5.8.3使用shift和tshift在時間序列數據中引入滯後136
5.8.4練習41:使用shift和tshift移動數據中的時間137
5.8.5時間序列中的自相關139
5.9交互式時態數據可視化141
5.9.1 Bokeh基礎141
5.9.2使用Bokeh的優點141
5.9.3練習42 :使用Bokeh為靜態折線圖增加交互性142
5.9.4練習43:改變折線圖中線的顏色和寬度144
5.9.5練習44:增加方框標註來找出數據集中的異常值145
5.9.6 Bokeh中的交互性147
5.9.7實踐活動5:創建一個交互式時態數據可視化148
5.10小結150

第6章地理數據交互式可視化151
6.1本章介紹151
6.2等值線地圖152
6.2.1世界等值線地圖152
6.2.2練習45:創建一個世界等值線地圖153
6.2.3練習46:調整一個世界等值線地圖155
6.2.4練習47:為等值線地圖增加動畫159
6.2.5美國各州地圖162
6.2.6練習48:創建美國各州的等值線地圖163
6.3在地理地圖上繪圖165
6.3.1散點圖166
6.3.2練習49:在一個地理地圖上繪製散點圖166
6.3.3氣泡圖168
6.3.4練習50:在地理地圖上繪製氣泡圖168
6.3.5地理地圖上的折線圖174
6.3.6練習51:在地理地圖上繪製折線圖174
6.3.7實踐活動6:創建一個等值線地圖表示全世界可再生能源生產和消費總量179
6.4小結183

第7章避免創建交互式可視化的常見陷阱184
7.1本章介紹184
7.2數據格式化和解釋184
7.2.1避免處理臟數據時常見的問題185
7.2. 2異常值185
7.2.3練習52:使用箱形圖可視化表示數據集中的異常值186
7.2.4練習53:處理異常值189
7.2.5缺失數據191
7.2.6練習54:處理缺失值191
7.2.7重複實例和/或特徵193
7.2.8不好的特徵選擇194
7.2.9實踐活動7:確定在一個散點圖上可視化哪些特徵195
7.3數據可視化197
7.3.1選擇可視化197
7.3.2可視化數據時的常見陷阱199
7.3.3練習55:創建一個讓人困惑的可視化199
7.3.4實踐活動8:創建一個柱狀圖改善可視化202
7.4可視化過程速查表203
7.5小結205

第8章附錄207
8.1第1章:Python可視化介紹:基礎和定制繪圖207
8.1.1實踐活動1:分析不同場景並生成適當的可視化207
8.2第2章:靜態可視化:全局模式和匯總統計212
8.2.1實踐活動2:設計靜態可視化表示全局模式和匯總統計212
8.3第3章:從靜態到交互式可視化215
8.3.1實踐活動3:使用PlotlyExpress創建不同的交互式可視化215
8.4第4章:基於層次的數據交互式可視化219
8.4.1實踐活動4:生成一個柱狀圖和一個熱圖表示GooglePlayStoreApps數據集中的內容分級類型219
8.5第5章:基於時間的數據交互式可視化223
8.5.1實踐活動5:創建一個交互式時態數據可視化223
8.6第6章:地理數據交互式可視化227
8.6.1實踐活動6:創建一個等值線地圖表示全世界可再生能源生產和消費總量227
8.7第7章:避免創建交互式可視化的常見陷阱232
8.7.1實踐活動7:確定在一個散點圖上可視化哪些特徵232
8.7.2實踐活動8:創建一個柱狀圖改善可視化236