零基礎學 Python 爬蟲、數據分析與可視化從入門到精通

孟兵,李傑臣 編著

  • 出版商: 機械工業
  • 出版日期: 2020-12-01
  • 定價: $539
  • 售價: 7.9$426
  • 貴賓價: 7.5$404
  • 語言: 簡體中文
  • 頁數: 376
  • 裝訂: 平裝
  • ISBN: 7111668995
  • ISBN-13: 9787111668992
  • 相關分類: Data ScienceWeb-crawler 網路爬蟲
  • 立即出貨 (庫存 < 4)

買這商品的人也買了...

商品描述

在這個數據為王的時代,無論是從事何種行業,每天都會與海量的且類型多樣的數據打交道,
如何從這些數據中獲取需要的信息,並進行相應的分析和可視化展示,是很多程序員和職場人士非常關心的一個問題。
本書以功能強大且容易上手作Python語言為基礎,全面講解了數據的獲取、處理、分析及可視化的呈現。
全書共17章,內容涉及Python基礎知識、Python數據處理和分析的實用模塊、數據分析、數據爬蟲技術、數據可視化等方面。
還對數據分析中的幾大經典算法,數據決策樹、關聯規則、聚類與分也進行了詳細的介紹。
為了便於讀者對Python知識的掌握,本書還提供了大量的編程代碼以及實戰案例。
本書適合各行各業的數據分析從業人員學習,也適合想要提高工作效率的職場人士,
對於Python編程感興趣的讀者,本書也是一本不錯的參考讀物。

目錄大綱

前言
如何獲取學習資源
第1章 Python快速上手
1.1Python編程環境的搭建 13
1.2Python的模塊 19
1.2.1初識模塊 19
1.2.2模塊的安裝 19

第2章 Python的基礎語法知識
2.1變量 23
2.2數據類型:數字與字符串 24
2.2.1數字 24
2.2.2字符串 25
2.2.3數據類型的查詢 27
2.2.4數據類型的轉換 28
2.3數據類型:列表、字典、元組與集合 29
2.3.1列表 29
2.3.2字典 33
2.3.3元組和集合 34
2.4運算符 35
2.4.1算術運算符和字符串運算符 35
2.4.2比較運算符 36
2.4.3賦值運算符 37
2.4.4邏輯運算符 38
2.5編碼基本規範 38
2.5.1縮進 39
2.5.2註釋 39
2.6控制語句 41
2.6.1if語句 41
2.6.2for語句 42
2.6.3while語句 43
2.6.4控制語句的嵌套 44
2.7函數 45
2.7.1內置函數 45
2.7.2自定義函數 51
2.8模塊的導入 53
2.8.1import語句導入法 53
2.8.2from語句導入法 54

第3章 數組的存儲和處理—NumPy模塊
3.1創建數組 56
3.1.1使用array()函數創建數組 56
3.1.2創建等差數組 57
3.1.3創建隨機數組 59
3.2查看數組的屬性 61
3.3選取數組元素 63
3.3.1一維數組的元素選取 63
3.3.2二維數組的元素選取 66
3.4數組的重塑與轉置 68
3.4.1一維數組的重塑 69
3.4.2多維數組的重塑 70
3.4.3數組的轉置 71
3.5數組的處理 72
3.5.1添加數組元素 72
3.5.2刪除數組元素 75
3.5.3處理數組的缺失值 76
3.5.4處理數組的重復值 77
3.5.5拼接數組 77
3.5.6拆分數組 79
3.6數組的運算 81
3.6.1數組之間的四則運算 81
3.6.2數組元素的統計運算 82

第4章 數據的簡單處理—pandas模塊入門
4.1數據結構 85
4.1.1Series對象 85
4.1.2DataFrame對象 87
4.2讀取數據 88
4.2.1讀取Excel工作簿數據 89
4.2.2讀取csv文件數據 93
4.3查看數據 94
4.3.1查看數據的前幾行 94
4.3.2查看數據的行數和列數 95
4.3.3查看數據的類型 96
4.4選擇數據 97
4.4.1選擇行數據 97
4.4.2選擇列數據 100
4.4.3同時選擇行列數據 103
4.5修改行標簽和列標簽 104

第5章 數據的高級處理—pandas模塊進階
5.1數據的查找和替換 106
5.1.1查找數據 106
5.1.2替換數據 108
5.2數據的處理 110
5.2.1插入數據 110
5.2.2刪除數據 111
5.2.3處理缺失值 115
5.2.4處理重復值 118
5.2.5排序數據 121
5.2.6篩選數據 123
5.3數據表的處理 125
5.3.1轉置數據表的行列 125
5.3.2將數據表轉換為樹形結構 125
5.3.3數據表的拼接 126
5.4數據的運算 130
5.4.1數據的統計運算 131
5.4.2獲取數值分佈情況 133
5.4.3計算相關系數 134
5.4.4分組匯總數據 135
5.4.5創建數據透視表 137
5.5案例:獲取並分析股票歷史數據 138

第6章 使用Python進行數據分析
6.1相關性分析 143
6.1.1獲取股價數據 143
6.1.2合並股價數據 146
6.1.3股價數據相關性分析 148
6.2假設檢驗 150
6.3方差分析 152
6.3.1方差分析的基本步驟 152
6.3.2單因素方差分析的代碼實現 159
6.3.3雙因素方差分析的代碼實現 162
6.3.4利用第三方模塊快速完成方差分析 164
6.4描述性統計分析 167
6.4.1描述性統計指標的計算 167
6.4.2數據的分佈狀態分析 169
6.4.3數據的頻數和頻率分析 171
6.5線性回歸分析 174
6.5.1線性回歸分析的數學原理 174
6.5.2線性回歸分析的思路 175
6.5.3廣告費與銷量的一元線性回歸分析 178
6.5.4不同渠道的廣告費與銷量的多元線性回歸分析 182

第7章 Python爬蟲基礎
7.1認識網頁結構 188
7.1.1查看網頁的源代碼 188
7.1.2網頁結構的組成 189
7.1.3百度新聞頁面結構剖析 194
7.2requests模塊 196
7.2.1requests模塊獲取數據的方式 196
7.2.2get()函數的參數介紹 200
7.3案例:爬取豆瓣電影動畫排行榜 202
7.4正則表達式 205
7.4.1正則表達式基礎 205
7.4.2用正則表達式提取數據 209
7.5BeautifulSoup模塊 211
7.5.1實例化BeautifulSoup對象 212
7.5.2用BeautifulSoup對象定位標簽 212
7.5.3從標簽中提取文本內容和屬性值 217
7.6XPath表達式 219
7.6.1實例化etree對象 219
7.6.2用XPath表達式定位標簽並提取數據 220
7.6.3快速獲取標簽節點的XPath表達式 221
7.7數據清洗 222
7.8案例:爬取當當網的圖書銷售排行榜 225

第8章 Python爬蟲進階
8.1Selenium模塊基礎 229
8.1.1Selenium模塊的安裝與基本用法 229
8.1.2Selenium模塊的標簽定位 232
8.1.3Selenium模塊的標簽操作 235
8.2Selenium模塊進階 237
8.2.1模擬鼠標操作 237