Python 數據分析與可視化項目實戰

王振麗

  • 出版商: 清華大學
  • 出版日期: 2023-12-01
  • 定價: $534
  • 售價: 8.5$454
  • 語言: 簡體中文
  • ISBN: 7302649049
  • ISBN-13: 9787302649045
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

  • Python 數據分析與可視化項目實戰-preview-1
  • Python 數據分析與可視化項目實戰-preview-2
  • Python 數據分析與可視化項目實戰-preview-3
Python 數據分析與可視化項目實戰-preview-1

買這商品的人也買了...

商品描述

《Python數據分析與可視化項目實戰》由淺入深地講解了使用Python語言實現大型商業案例項目數據分析的知識,幾乎覆蓋了當今主流的數據分析行業。全書共9章,分別講解了電影產業市場數據分析和可視化系統,電商客戶數據分析和可視化系統,房產信息數據分析和可視化系統,城市智能交通數據分析和可視化系統,NBA球星技術統計信息數據分析和可視化系統,股票數據分析和可視化系統,民宿信息數據分析和可視化系統,足球數據可視化分析和機器學習預測系統,網絡輿情數據分析和可視化系統等。 《Python數據分析與可視化項目實戰》適用於已經瞭解Python語言基礎語法,希望進一步提高自己Python開發水平的讀者,同時還可以作為大專院校相關專業的師生用書和培訓機構的教材。

目錄大綱

目錄

第1章  電影產業市場數據分析和可視化系統(Flask+FastAPI+Vue+Echarts) 1

1.1  電影產業介紹 2

1.2  電影市場的需求分析 2

1.2.1  市場需要高質量作品 2

1.2.2  國內電影市場的變化 3

1.3  系統架構 3

1.4  準備數據 4

1.5  後端數據分析模塊 5

1.5.1  後端系統配置 5

1.5.2  註冊FastAPI訪問 6

1.5.3  URL錯誤處理 9

1.5.4  後端數據分析 11

1.5.5  後端主文件 15

1.5.6  日誌處理 16

1.6  前端數據可視化模塊 18

1.6.1  前端系統配置 18

1.6.2  前臺主頁 19

1.6.3  電影時長占比圖 28

1.6.4  電影上映年份趨勢圖 33

1.6.5  各國及地區電影出產量統計圖 37

1.6.6  電影類別排行統計圖 41

1.6.7  電影語言使用統計圖 46

1.6.8  各國及地區電影評分展示統計圖 52

第2章  電商客戶數據分析和可視化系統(Jupyter Notebook+Scikit-Learn+Matplotlib+Pandas) 59

2.1  電商行業發展介紹 60

2.1.1  國內電商市場現狀分析 60

2.1.2  電商行業發展趨勢介紹 60

2.2  需求分析 61

2.2.1  電商的商業模式 61

2.2.2  核心指標需求分析 62

2.2.3  指標體系需求分析 63

2.2.4  數據分析方法 65

2.2.5  電商平臺“人”的指標思維導圖 66

2.3  系統架構 66

2.4  準備數據 67

2.5  數據分析 68

2.5.1  數據清洗 68

2.5.2  數據分析 73

2.5.3  數據建模 78

第3章  房產信息數據分析和可視化系統(網絡爬蟲+MySQL+pylab實現) 85

3.1  背景介紹 86

3.1.1  行業發展現狀 86

3.1.2  房地產行業市場調查 86

3.2  需求分析 87

3.3  系統架構 87

3.4  系統設置 88

3.4.1  選擇版本 88

3.4.2  保存日誌信息 89

3.4.3  設置創建的文件名 89

3.4.4  設置爬取城市 91

3.4.5  處理區縣信息 93

3.4.6  處理日期和時間 95

3.5  破解反爬機制 95

3.5.1  定義爬蟲基類 96

3.5.2  瀏覽器用戶代理 97

3.5.3  在線IP代理 98

3.6  爬蟲爬取信息 99

3.6.1  設置解析元素 99

3.6.2  爬取二手房信息 99

3.6.3  爬取樓盤信息 103

3.6.4  爬取小區信息 107

3.6.5  爬取租房信息 110

3.7  數據可視化 115

3.7.1  爬取數據並保存到數據庫 115

3.7.2  可視化濟南市房價最貴的4個小區 120

3.7.3  可視化濟南市主要地區的房價均價 121

3.7.4  可視化濟南市主要地區的房源數量 123

3.7.5  可視化濟南市各區的房源數量所占百分比 124

第4章  城市智能交通數據分析和可視化系統(Pandas+Matplotlib+Numpy) 127

4.1  背景介紹 128

4.2  需求分析 128

4.2.1  城市交通存在的問題 128

4.2.2  智能交通建設的必要性 129

4.2.3  項目目標 130

4.3  系統架構 131

4.4  從CSV文件讀取數據 132

4.4.1  讀取並顯示CSV文件中的前3條騎行數據 132

4.4.2  讀取並顯示CSV文件中指定列的數據 134

4.4.3  用統計圖可視化CSV文件中的數據 135

4.4.4  選擇指定數據 136

4.5  日期相關操作 142

4.5.1  統計每個月的騎行數據 142

4.5.2  展示某街道前5天的騎行數據信息 143

4.5.3  統計周一到周日每天的數據 145

4.5.4  使用Matplotlib圖表可視化展示統計數據 146

第5章  NBA球星技術統計信息數據分析和可視化系統(網絡爬蟲+Referer反爬+JSON+Matplotlib+Pandas) 149

5.1  背景介紹 150

5.1.1  NBA介紹 150

5.1.2  NBA的全球化 150

5.2  需求分析 151

5.3  系統架構 151

5.4  球員特徵可視化 152

5.4.1  爬取球員得分信息 152

5.4.2  球員數據聚類分析 155

5.5  球員數據可視化雷達圖 161

5.5.1  分析季後賽杜蘭特的數據 161

5.5.2  分析季後賽庫里的數據 166

5.6  球星命中數據信息可視化 167

5.6.1  繪制籃球場 168

5.6.2  爬取球星庫里的投籃信息:Referer反爬 171

5.6.3  庫里投籃信息的可視化 174

5.6.4  杜蘭特投籃信息的可視化 175

第6章  股票數據分析和可視化系統(網絡爬蟲+Selenium+TuShare+Matplotlib+Scikit-Learn) 177

6.1  背景介紹 178

6.2  需求分析 178

6.2.1  股票歷史數據分析的目的與意義 178

6.2.2  股票數據分析 179

6.3  系統架構 179

6.4  爬取股票實時漲幅榜信息 180

6.4.1  準備Selenium環境 180

6.4.2  爬取數據 181

6.4.3  獲取指定股票所屬行業信息 182

6.4.4  獲取漲幅榜和跌幅榜信息 183

6.4.5  將漲幅榜前10和跌幅榜前10股票數據保存到Excel文件 184

6.5  AI選股系統 186

6.5.1  準備TuShare 186

6.5.2  跟蹤熱點板塊 187

6.5.3  數據建模和評估分析 199

第7章  民宿信息數據分析和可視化系統(網絡爬蟲+Django+Echarts可視化) 219

7.1  背景介紹 220

7.2  系統架構 221

7.3  爬蟲爬取信息 221

7.3.1  系統配置 221

7.3.2  Item處理 222

7.3.3  具體爬蟲 223

7.3.4  破解反爬字體加密 232

7.3.5  下載器中間件 235

7.3.6  保存爬蟲信息 239

7.4  數據可視化 244

7.4.1  數據庫設計 244

7.4.2  登錄驗證表單 247

7.4.3  視圖顯示 248

第8章  足球數據可視化分析和機器學習預測系統(Matplotlib+Pandas+Seaborn+Scikit-Learn實現) 259

8.1  歐洲足球五大聯賽 260

8.2  系統架構 261

8.3  準備數據 261

8.4  數據可視化分析 262

8.4.1  事件收集 262

8.4.2  射門數據可視化 266

8.4.3  球隊和球員數據可視化 268

8.4.4  聯賽數據可視化 275

8.4.5  巴塞羅那隊的進球數據百分比餅圖 279

8.4.6  紅牌和黃牌數據可視化 280

8.4.7  進球數據可視化 285

8.4.8  梅西和C羅的數據可視化 292

8.4.9  五大聯賽的球員數量可視化 295

8.5  比賽預測 296

8.5.1  讀取數據 296

8.5.2  清洗數據 299

8.5.3  邏輯回歸算法 300

8.5.4  梯度提升模型 301

8.5.5  隨機森林 302

8.5.6  深度學習 303

第9章  網絡輿情數據分析和可視化系統(Scikit-Learn+Tornado+Celery+FastAPI+Pandas+Vue) 305

9.1  系統介紹 306

9.1.1  輿情數據分析的意義 306

9.1.2  輿情熱度分析 306

9.2  架構設計 307

9.2.1  模塊分析 307

9.2.2  系統架構 308

9.3  微博爬蟲 309

9.3.1  系統配置 309

9.3.2  批量賬號模擬登錄 309

9.3.3  爬取信息 311

9.4  系統後端 322

9.4.1  系統配置 322

9.4.2  數據結構設計 323

9.4.3  數據處理 327

9.4.4  微博話題分析 334

9.5  系統前端 341

9.5.1  API導航 341

9.5.2  博文詳情 342