Python數據分析與可視化應用
唐藝,李光傑,侯勝傑
- 出版商: 電子工業
- 出版日期: 2022-05-01
- 定價: $354
- 售價: 8.5 折 $301
- 語言: 簡體中文
- 頁數: 264
- ISBN: 7121434377
- ISBN-13: 9787121434372
-
相關分類:
Data Science
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書結合作者多年工程和實踐經驗,從Python 基礎編程語法入手,系統介紹了基於Python 語言進行數據處理、分析與可視化展示所需的各項知識和技術。讀者無須特別的數學或統計方面的理論知識,只需理解數據分析的思路,就可以參考示例學會針對實際問題進行有效數據分析的步驟和方法。 本書分4 篇共20 章,主要內容涉及Python 基本語法、程序控制結構、函數、面向對象基礎、文件操作、標準庫、正則表達式、numpy 庫、pandas 庫、數據預處理、matplotlib 可視化圖表、seaborn可視化圖表、pyecharts 可視化圖表、SciPy 科學計算、共享自行車案例及在線銷售案例。
目錄大綱
一篇Python基礎
1章Python概述2
1.1Python簡介2
1.1.1Python的起源2
1.1.2Python的發展2
1.2Python解釋器3
1.2.1安裝Python解釋器3
1.2.2交互運行模式4
1.2.3命令行運行模式4
1.3集成開發環境PyCharm5
1.3.1安裝PyCharm5
1.3.2創建項目7
1.3.3創建並運行Python文件8
2章Python編程基礎10
2.1常量和變量10
2.1.1常量和變量的定義10
2.1.2變量命名規則10
2.2簡單數據類型11
2.2.1數值類型11
2.2.2字符串12
2.2.3ne13
2.2.4布爾類型14
2.2.5數據類型轉換14
2.3算術運算15
2.4賦值運算符16
2.5字符串相關運算17
2.5.1字符串連接運算17
2.5.2字符串截取18
2.6輸出18
2.6.1print函數的基本用法19
2.6.2print函數格式化輸出20
2.7輸入23
2.8程序註釋23
3章程序控制結構25
3.1選擇結構25
3.1.1條件表達式25
3.1.2單分支結構if語句27
3.1.3二分支結構if-else語句27
3.1.4多分支結構if-elif-else語句29
3.2循環結構31
3.2.1for語句實現遍歷循環31
3.2.2while語句實現條件循環33
3.2.3循環結構中的else語句35
3.2.4break語句和continue語句36
4章組合數據類型39
4.1列表39
4.1.1列表的表示與訪問列表元素39
4.1.2遍歷列表40
4.1.3添加列表元素42
4.1.4刪除列表元素44
4.1.5列表排序45
4.2元組46
4.3字典47
4.3.1創建字典48
4.3.2添加和刪除鍵值對49
4.3.4遍歷字典49
4.3.5字典嵌套50
5章函數52
5.1函數的定義和調用52
5.2函數參數傳遞54
5.3列表作為函數參數57
5.3.1簡單數據類型參數傳遞值57
5.3.2組合數據類型參數公用存儲空間57
5.3.3組合數據類型的數據作為函數參數的應用58
5.4模塊59
5.4.1創建模塊59
5.4.2導入模塊60
6章類和對象63
6.1類和對象的概念63
6.2定義只具有方法的類和對象64
6.2.1定義類64
6.2.2實例化對象65
6.3對像初始化方法及屬性66
6.3.1對像初始化方法_init_()66
6.3.2定義類的屬性66
6.3.3訪問對象屬性67
6.3.4輸出對象的描述信息68
6.3.5封裝性69
6.4類和對象應用實例69
6.5類的繼承70
6.5.1繼承的定義70
6.5.2_init_()方法的繼承72
6.5.3重寫父類方法73
7章文件作74
7.1基本作74
7.2打開文件75
7.2.1文件指針75
7.2.2打開方式76
7.3讀取文件77
7.4寫入文件78
7.4.1使用write()方法向文件中寫入內容78
7.4.2使用write()方法向文件中追加內容79
7.5讀寫CSV文件80
7.5.1讀取數據80
7.5.2寫入數據81
8章常用Python標準庫83
8.1datetime模塊83
8.1.1date類83
8.1.2time類86
8.1.3datetime類86
8.1.4timedelta類87
8.1.5時間轉化88
8.1.6設置日期時間格式88
8.2math模塊89
8.3random模塊90
8.4os模塊92
二篇數據分析
9章正則表達式98
9.1正則表達式中的元字符98
9.1.1主要元字符98
9.1.2對字符進行轉義99
9.1.3標記開始與結束99
9.2匹配一組字符100
9.2.1定義一組字符100
9.2.2對一組字符取反100
9.2.3使用區間簡化一組字符的定義100
9.3使用量詞進行多次匹配101
9.3.1常用量詞101
9.3.2貪婪和非貪婪匹配101
9.3.3分組102
9.4使用re模塊處理正則表達式102
9.4.1Python正則表達式的語法102
9.4.2匹配字符串102
9.4.3替換字符串106
9.4.4分割字符串107
10章使用numpy進行數值計算108
10.1使用numpy生成數組108
10.1.1常用數組生成函數108
10.1.2ndarray對象屬性109
10.1.3數組變換110
10.1.4numpy的隨機數函數112
10.2數組的索引和切片112
10.2.1數組的索引112
10.2.2數組的切片113
10.3數組的運算114
10.3.1數組和標量間的運算114
10.3.2通用函數114
10.3.3統計運算115
10.4數組的存儲與讀取116
10.4.1數組的存儲116
10.4.2數組的讀取116
11章pandas數據分析模塊118
11.1pandas數據結構118
11.1.1創建Series數據118
11.1.2創建DataFrame數據120
11.2添加、修改和刪除數據121
11.2.1添加數據122
11.2.2修改數據123
11.2.3刪除數據124
11.3索引作126
11.3.1重設索引126
11.3.2將已有列設置為索引126
11.3.3重新命名索引127
11.3.4層次化索引128
11.4選取數據130
11.4.1Series數據的選取130
11.4.2DataFrame數據的選取131
11.5數據運算133
11.5.1算術運算133
11.5.2函數應用和映134
11.5.3匯總與統計135
11.5.4值和值計數138
12章使用pandas獲取和寫入數據140
12.1文本數據的讀取與存儲140
12.1.1CSV文件的讀取140
12.1.2TXT文件的讀取142
12.1.3文本數據的存儲143
12.2Ecel與JSON數據143
12.2.1Ecel數據143
12.2.2JSON數據144
12.3數據庫的讀取與寫入145
12.3.1SQLAlchemy包的安裝和數據庫的鏈接145
12.3.2SQLite數據庫寫入和讀取數據145
13章數據預處理147
13.1數據清洗147
13.1.1處理缺失值147
13.1.2刪除重複數據150
13.1.3替換值151
13.1.4利用函數或映進行數據轉換152
13.2對數據進行排序和排名153
13.2.1數據排序153
13.2.2數據排名155
13.3數據合併和重塑156
13.3.1數據合併156
13.3.2數據連接157
13.3.3數據轉置159
13.4字符串處理159
13.4.1字符串方法159
13.4.2使用正則表達式160
14.1數據分組161
14.1.1認識GroupBy161
14章數據的分組與聚合161
14.1.2按照列名進行分組162
14.1.3按照Series數據進行
分組163
14.2數據聚合164
14.2.1聚合函數164
14.2.2使用aggregate()方法
進行數據聚合165
14.3長表變寬表166
14.3.1什麼是長表和寬表166
14.3.2使用pivot函數將長表變為寬表167
14.3.3使用pivot_table函數進行數據透視分析167
三篇數據可視化
15章使用matplotlib可視化數據170
15.1創建圖表的基本方法170
15.1.1圖表的基本組成元素170
15.1.2建立畫布和坐標系171
15.1.3設置坐標軸175
15.1.4設置網格線177
15.1.5設置圖例178
15.1.6設置圖表標題179
15.1.7設置數據標籤180
15.1.8設置數據表181
15.1.9繪製常用幾何圖形182
15.2常用圖表的創建186
15.2.1折線圖186
15.2.2柱形圖188
15.2.3餅圖和圓環圖191
15.2.4散點圖和氣泡圖191
15.2.5直方圖193
15.2.6箱形圖194
15.2.7等高線圖196
15.2.8階梯圖196
16章使用seaborn可視化數據198
16.1seaborn的樣式198
16.1.1基本樣式198
16.1.2自定義樣式199
16.2繪製分佈圖200
16.2.1單變量分佈圖200
16.2.2多變量分佈圖202
16.3繪製分類圖204
16.3.1分類散點圖204
16.3.2箱形圖與琴形圖204
16.3.3回歸圖205
17章使用pyecharts動態可視化數據207
17.1pyecharts的版本與特點207
17.2pyechats可視化的流程及選項設置207
17.2.1pyecharts可視化的一般流程207
17.2.2pyecharts選項設置209
17.2.3pyecharts常用的圖表設置方法211
17.3使用pyecharts創建圖表214
17.3.1餅圖和圓環圖214
17.3.2折線圖和麵積圖216
17.3.3散點圖和氣泡圖218
17.3.4直方圖和箱形圖219
17.3.5詞云圖221
17.3.6數據地圖222
17.3.7雷達圖224
17.3.8儀錶盤和水球圖225
18章使用SciPy進行科學計算和統計分析227
18.1使用SciPy進行科學計算227
18.1.1獲取基本科學常量227
18.1.2線性代數和微積分228
18.1.3插值與擬合229
18.2使用SciPy進行統計分析230
18.2.1正態分佈有關計算230
18.2.2通過樣本推斷總體參數231
18.2.3檢驗均值232
18.2.4檢驗均值差233
18.2.5卡方檢驗234
18.2.6回歸分析235
篇實例應用
19章共享自行車大數據分析239
19.1數據預處理239
19.1.1讀取數據239
19.1.2數據清洗與轉換240
19.2探索數據規律241
19.2.1年份數據比較241
19.2.2月份趨勢比較241
19.2.3每日高峰時段分析243
19.2.4不同季度差異分析244
19.2.5週末和工作日差異分析245
20章在線銷售數據分析與建模246
20.1獲取和清洗數據246
20.1.1獲取數據246
20.1.2了解數據的基本特徵247
20.1.3清洗與整理數據248
20.2分析與可視化銷售數據249
20.2.1查看銷量的描述統計結果249
20.2.2按產品對銷量進行匯總249
20.2.3按城市匯總產品250
20.2.4對產品和城市進行交分析251
20.3銷量趨勢分析251
20.3.1日期格式轉換252
20.3.2時間和季節趨勢分析252
20.3.3比較不同城市季節趨勢的差異253