Jupyter Notebook 數據分析入門與實戰

[日]池內孝啟 片柳薫子 岩尾遙 都利來

  • 出版商: 人民郵電
  • 出版日期: 2020-11-01
  • 售價: $594
  • 貴賓價: 9.5$564
  • 語言: 簡體中文
  • 頁數: 391
  • 裝訂: 平裝
  • ISBN: 7115445494
  • ISBN-13: 9787115445490
  • 相關分類: Data Science
  • 立即出貨 (庫存 < 4)

  • Jupyter Notebook 數據分析入門與實戰-preview-1
Jupyter Notebook 數據分析入門與實戰-preview-1

買這商品的人也買了...

相關主題

商品描述

Jupyter Notebook 被廣泛用作數據分析的工具或學習Python 的開發環境。
本書共10章,重點介紹瞭如何使用Jupyter Notebook 進行數據可視化分析,
包括Jupyter Notebook 的基礎操作、使用pandas 進行數據分析、
使用Matplotlib 繪圖、完全掌握Matplotlib、使用Bokeh 繪圖、
完全掌握Bokeh、自定義Jupyter Notebook、使用雲端Jupyter Notebook、
用Jupyter Notebook 編寫Ruby 和R 語言等內容。

作者簡介

池內孝啟


曾擔任數家IT創業公司,以及株式會社ALBERT的執行董事,
在2015年創立株式會社eurie(現改名為株式會社slideship),
是該公司的Founder&CEO。 2017年開發了用於在線製作和演示幻燈片的網站slideship.com。
同時也是Python和數據分析者社區PyData.Tokyo的發起人之一。
著有《精選python庫技巧大全》(2015年 技術評論社出版),
《Python程序員手冊》(2015年 技術評論社出版)等。

片柳薫子

在農研機構農業環境變動研究中心從事研究工作,也是PyLadies Tokyo的運營工作人員。
從2014年開始使用Python進行數據分析。

岩尾遙

曾擔任多家公司的軟件設計師、架構師等,現在就職於谷歌,負責Google Cloud Platform的開發。
積極參與各種相關活動以使更多的人能夠使用Python雲環境。

都利來

使用Python進行金融數據分析,Python×金融社區 fin-py的主要創始人。

目錄大綱

第 1章導入Jupyter Notebook
1-1 Project Jupyter 的起源 2
1-2 利用Anaconda 構建環境 3
在Windows上安裝Anaconda 3
在macOS 上安裝Anaconda 10
1-3 conda 命令的使用方法 14
使用conda命令進行包管理 15
刪除和更新軟件包 15
Anaconda虛擬環境 16
激活虛擬環境 16
關閉conda環境 17
1-4 設置環境支持中文 18
繪制圖形時的亂碼問題 18
安裝中文字體 19
使用中文字體 20
通過配置文件設置中文字體 24

第 2章Jupyter Notebook 的基礎操作
2-1 在Jupyter Notebook 上運行代碼 28
新建Notebook 28
運行代碼 30
變量和函數的定義及用法 31
使用Python的標準庫 32
使用代碼補全功能 34
2-2 Jupyter Notebook 的界面 34
File菜單 34
Edit 菜單 35
View 菜單 36
Insert 菜單 38
Cell菜單 38
Kernel菜單 39
Widgets菜單 40
Help菜單 40
工具欄 40
2-3 Jupyter Notebook 的快捷鍵 42
編輯模式與命令模式 42
顯示快捷鍵一覽 42
常用的快捷鍵 43
2-4 Jupyter Notebook 的保存和復用 44
Notebook文件(.ipynb文件)的內部結構 44
保存文件 45
Auto Save 功能 46
Checkpoint 46
讀取文件並復用 47
2-5 使用Markdown 和公式 47
什麽是Markdown 47
使用Markdown 47
使用Markdown 為Notebook的內容寫註釋 49
使用公式 50
上傳圖片 51
2-6 使用魔法命令 52
Shell腳本(命令行)的使用方法 52
魔法命令的基本用法 52
常用的魔法命令 53
%history 55
%ls 55
%autosave 56
%matplotlib 56
2-7 共享Jupyter Notebook 的方法 58
在GitHub上公開Notebook 58
nbviewer 59

第3章使用pandas進行數據分析63
3-1 pandas 的特點 64
3-2 樣本數據的說明 64
anime.csv文件 65
anime_master.csv文件 66
anime_split_genre.csv文件 67
anime_genre_top10.csv文件 67
anime_genre_top10_pivoted.csv文件 68
anime_stock_price.csv文件 68
anime_stock_returns.csv文件 69
4816.csv文件、3791.csv文件、n225.csv文件 69
3-3 Series 70
新建Series 71
使用標簽選擇數據 71
通過指定位置選擇數據 72
使用布爾值選擇數據 73
3-4 DataFrame 74
新建DataFrame 75
使用標簽選擇數據 75
使用iloc選擇數據 76
通過指定列名選擇數據 77
使用布爾值選擇數據 77
3-5 讀取各種格式的數據 78
讀取CSV 文件 78
讀取Excel 文件 81
使用SQL 讀取 82
讀取HTML 文件 82
3-6 數據處理 83
用布爾值篩選數據 84
使用where方法篩選數據 84
修改數據 85
去掉缺失值 85
數據類型 87
排序 90
應用函數到每個元素 90
3-7 統計計算 93
快速統計匯總 94
3-8 交叉統計 96
使用groupby()統計 96
使用pivot_table()統計 98
交叉統計 98
3-9 時間序列數據的處理 100
獲取股票價格 100
使用時間序列數據的函數 101
DatetimeIndex 103
篩選時間序列數據 105
採樣 107
3-10 數據可視化 108
在Notebook中顯示圖表 108
使用Series 繪圖 109
使用DataFrame繪圖 110
創建折線圖 111
創建散點圖 112
創建柱形圖 113
創建直方圖 115
創建箱形圖 115
創建餅圖 116

第4章使用Matplotlib繪圖
4-1 Matplotlib 是什麽 118
4-2 繪圖基礎 119
繪制圖表準備工作 119
Figure和Subplot 120
使用add_subplot()添加Subplot 121
使用subplots()來配置Subplot 123
應用樣式表 124
4-3 折線圖 125
創建折線圖 126
活用折線圖 127
繪制雙軸圖表 129
4-4 散點圖 131
創建散點圖 131
活用散點圖 132
創建組散點圖 135
4-5 柱形圖 136
創建柱形圖 137
活用柱形圖 138
創建分組柱形圖 140
活用分組柱形圖 142
創建堆積柱形圖 144
活用堆積柱形圖 146
4-6 直方圖 147
創建直方圖 147
活用直方圖 149
創建各式各樣的直方圖 152
4-7 箱形圖 159
創建箱形圖 159
活用箱形圖 161
批量設定箱形圖樣式 163
設置每個箱子的樣式 166
4-8 餅圖 168
繪制餅圖 169
餅圖的樣式 170
活用餅圖 172

第5章完全掌握Matplotlib
5-1 繪制各種圖形 176
繪制圓弧 176
繪制箭頭 177
繪制圓形 178
繪制正多邊形 179
繪制橢圓 180
繪制扇形 180
繪制矩形 181
繪制多邊形 182
5-2 設置圖形對象和子圖樣式 183
設置圖形對象的樣式 183
設置子圖樣式 184
設置子圖之間的邊距 184
5-3 設置顏色與顏色映射 187
設置顏色和透明度 187
指定顏色 188
使用顏色映射 189
5-4 設置線條樣式 191
設置線條顏色和粗細 192
設置線條頭部的形狀 193
設置線條連接點的形狀 193
設置線條的類型 194
設置虛線以及虛線頭的形狀 196
設置虛線的連接點形狀 196
5-5 設置字體和文本框樣式 197
繪制文本 198
設置字體樣式 199
設置文本框樣式 200
設置文本框的水平對齊方式 201
設置文本框的垂直對齊方式 202
設置文本框內文本的水平對齊方式 203
設置文本框內文本的行間距 204
旋轉文本框 204
5-6 設置圖形的軸和刻度 207
設置軸的範圍 207
統一軸設置 208
設置對數軸 209
設置多個軸 210
設置軸標簽 211
設置主刻度與主刻度線標簽 212
設置刻度樣式 213
設置刻度線 215
5-7 圖例與標題 216
設置圖例 216
設置圖例位置 217
設置子圖標題 219
設置圖形標題 220
設置圖例和標題樣式 221
5-8 繪圖樣式表 222
導出樣式列表 222
應用樣式 223
5-9 導出文件 223
導出文件 224
設置導出繪圖對象的樣式 225
導出時調整大小 226
5-10 show() 函數 228
show() 函數 228
確認plt.show() 的操作內容 229
使用Matplotlib繪制圖形的兩種風格 232

第6章使用Bokeh繪圖
6-1 Bokeh 是什麽 236
6-2 Bokeh 的特點 237
與Matplotlib的不同之處 237
3 種級別的接口 237
6-3 繪圖基礎 240
導入必須要用到的模塊 240
把圖形輸出到Notebook上 241
創建Chart 實例 241
調整圖形屬性 241
輸出圖形 242
輸出圖形至HTML 文件 242
6-4 折線圖 243
使用類列表類型數據 243
使用字典類型數據 244
使用DataFrame類型數據 245
中級別接口 246
6-5 散點圖 248
顏色區分 249
中級別接口 250
6-6 柱形圖 251
使用類列表類型數據 252
使用字典類型數據 252
使用DataFrame類型數據 252
聚合 254
分組 254
創建堆積柱形圖 255
中級別接口 256
6-7 直方圖 258
使用類列表類型數據 258
使用DataFrame類型數據 258
顏色區分 260
創建相對頻率直方圖 261
中級別接口 261
6-8 箱形圖 262
6-9 餅圖 263
使用類列表類型數據 264
使用字典類型數據 264
使用DataFrame類型數據 265
分組 265

第7章完全掌握Bokeh
7-1 繪制各種圖形 268
繪制文本 268
繪制基本圖形 269
繪制可變形狀的圖形 269
繪制直線 275
帶標簽數據(ColumnDataSource) 276
7-2 設置各種對象屬性 277
指定參數值 277
設置對象屬性 278
7-3 設置顏色 278
可配置的屬性 278
設置顏色 279
通過設置alpha屬性調整對象的透明度 281
不同位置設置不同顏色 281
Bokeh.palettes模塊 281
7-4 設置各種線條樣式 283
可配置的屬性 283
設置線條粗細 284
設置線條顏色 284
設置線條連接點 285
設置線條頭部 286
設置線條類型 287
7-5 設置文本 288
可配置的屬性 288
設置字體 289
設置字體大小 289
設置字體樣式 290
設置文本顏色 290
設置文本的水平對齊方式 291
設置文本的垂直對齊方式 292
7-6 設置圖屬性 292
設置圖的大小 292
設置圖的背景顏色 293
設置圖的邊距 293
設置圖的外邊框 294
設置圖的標題 295
7-7 設置圖形樣式 297
設置圖形樣式 297
在選中/ 釋放圖形時設置樣式 298
7-8 設置軸屬性 299
指定起始位置和結束位置並設置軸範圍 299
用指定元素來設置軸範圍 300
設置時間序列軸 301
設置對數軸 302
設置多個軸 302
7-9 設置軸樣式 304
設置軸樣式 304
設置軸的顯示範圍 305
刻度樣式 305
設置刻度標簽樣式 305
設置刻度比例的長度 306
調整刻度線 306
7-10 設置刻度線樣式 309
設置主刻度線樣式 309
設置輔刻度線樣式 309
設置陰影 310
設置刻度線的範圍 310
7-11 設置圖例 311
設置圖例樣式 311
設置圖例的位置 312
設置圖例的佈局 313
設置圖例內部 314
7-12 設置多圖佈局 315
垂直排列 315
橫向排列 315
在網格中排列① 316
在網格中排列② 316
自定義顯示位置 317
7-13 活用繪圖工具的交互式操作 317
設置工具欄的位置 317
選擇內置工具 319
修改工具的激活狀態 321
設置Hover工具 322
7-14 繪制交互式實時圖形 324
動態修改圖表 324
動態修改圖形 325
繪制動畫 326
運用ipywidgets進行交互式可視化 327

第8章自定義Jupyter Notebook
8-1 設置啟動選項 330
啟動設定 330
使用配置文件 332
8-2 自定義樣式 334
使用CSS 334

第9章使用雲端Jupyter Notebook
9-1 Cloud Datalab-Google Cloud Platform 338
Cloud Datalab 338
啟動Cloud Datalab 339
使用Cloud Datalab 340
連接到Cloud Datalab 343
如何使用Cloud Datalab 344
使用BigQuery進行數據分析 346
顯示圖表 348
9-2 Azure Notebooks-Microsoft Azure 349
Azure Notebooks的特點 349
支持的運行環境 350
基本用法 350
Library與Notebook 351
如何使用Notebook 354
安裝其他軟件包 354


第 10章用Jupyter Notebook 編寫Ruby和R
10-1 用Jupyter Notebook 編寫Ruby 358
什麽是iruby 358
安裝iruby 358
使用Jupyter Notebook編寫Ruby 362
使用daru進行數據分析 363
使用Nyaplot繪圖 364
10-2 用Jupyter Notebook 編寫R 365
安裝R 365
安裝IRkernel 367
用Jupyter Notebook編寫R 367
使用R 進行數據分析 368

附錄
A-1 交互式ipywidgets 372
安裝ipywidgets 372
用interact() 函數實現 372
可使用的窗口控件 374
處理事件 374
窗口控件的佈局 375
與可視化工具聯動 376
A-2 製作幻燈片 380
幻燈片製作流程 382
轉換為幻燈片用的文件 384
幻燈片放映文件 386
Slide Type 386
A-3 JupyterLab 387
安裝和啟動 387
選項卡功能 388
Code Console 389