大數據分析挖掘與可視化

萬念斌

  • 出版商: 廈門大學
  • 出版日期: 2025-03-01
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • 頁數: 391
  • ISBN: 7561596324
  • ISBN-13: 9787561596326
  • 相關分類: 大數據 Big-dataData Science
  • 下單後立即進貨 (約4週~6週)

商品描述

本書基於Python語言和第三方庫Scrapy、NumPy、pandas、Sklearn、seaborn、Matplotlib編寫,結合大量的數據分析挖掘案例,詳細介紹大數據分析、挖掘與可視化的原理和方法,幫助讀者逐步掌握Python程序設計、大數據採集與Python爬蟲、數據清洗與轉換、數據建模與挖掘、數據分析和數據可視化等相關知識,提高解決實際問題的能力。

目錄大綱

第1章 大數據概述
1.1 大數據的時代背景與應用場景
1.2 大數據及其特點
1.3 大數據處理的相關技術
1.4 數據分析
1.4.1 數據分析術語
1.4.2 數據分析過程
1.4.3 Python數據分析和科學計算擴展庫介紹
1.5 數據挖掘
1.6 數據可視化
1.7 課後習題
第2章 Python大數據開發環境的搭建
2.1 Python開發環境的搭建
2.1.1 Python語言簡介
2.1.2 Python的下載、安裝和環境配置
2.2 PyCharm概述
2.2.1 認識PyCharm
2.2.2 PyCharm的安裝
2.2.3 PyCharm基本設置
2.3 Anaconda概述
2.3.1 Anaconda簡介
2.3.2 Anaconda的下載與安裝
2.4 PyCharm中導入Anaconda
2.5 Jupyter Notebook的安裝和使用
2.6 實驗
第3章 Python編程基礎
3.1 Python概述
3.2 Python基礎知識
3.2.1 Python代碼編寫規範
3.2.2 標識符、常量和變量
3.2.3 基本數據類型
3.2.4 運算符與表達式
3.3 Python程序的基本結構
3.3.1 選擇結構
3.3.2 循環結構
3.4 組合數據類型
3.4.1 列表
3.4.2 元組
3.4.3 字典
3.4.4 集合
3.5 函數與模塊
3.5.1 函數定義
3.5.2 函數調用
3.5.3 函數的參數
3.5.4 變量的作用域
3.5.5 匿名函數和遞歸函數
3.5.6 模塊
3.6 文件
3.6.1 文件的打開與關閉
3.6.2 文件的讀寫
3.6.3 文件的定位
3.7 課後習題
3.8 實驗
第4章 Python爬蟲
4.1 爬蟲概述
4.2 爬蟲技術原理
4.3 robots協議
4.4 Python爬蟲
4.4.1 re模塊
4.4.2 socket模塊
4.4.3 urllib模塊
4.4.4 Requests模塊
4.4.5 lxml模塊
4.5 Python多線程爬蟲
4.6 Scrapy爬蟲框架
4.6.1 Scrapy下載安裝
4.6.2 使用Scrapy爬取數據
4.7 Python爬蟲案例
4.8 課後習題
4.9 實驗
第5章 NumPy
5.1 認識NumPy
5.2 ndarray
5.2.1 創建NumPy數組
5.2.2 NumPy數組的屬性
5.2.3 NumPy數組的變換
5.2.4 索引與切片
5.2.5 NumPy數組的疊代器對象
5.3 NumPy數組的運算
5.3.1 四則運算和關系運算
5.3.2 邏輯運算
5.3.3 集合運算
5.4 NumPy函數的使用
5.4.1 NumPy數學函數
5.4.2 NumPy字符串函數
5.4.3 NumPy統計函數
5.4.4 NumPy排序函數
5.4.5 NumPy條件篩選函數
5.4.6 NumPy其他函數
5.5 NumPy數據文件的讀寫
5.5.1 二進制文件的讀寫
5.5.2 文本文件的讀寫
5.6 NumPy數據分析案例
5.7 課後習題
5.8 實驗
第6章 pandas
6.1 認識pandas
6.2 pandas數據結構
6.2.1 Series
6.2.2 DataFrame
6.2.3 Panel
6.3 pandas索引操作
6.3.1 索引和選取
6.3.2 重新索引和更換索引
6.4 pandas算術運算與數據對齊
6.4.1 Series的算術運算
6.4.2 DataFrame的算術運算
6.4.3 DataFrame與Series的混合算術運算
6.5 pandas數據讀寫
6.5.1 I/O API函數
6.5.2 pandas讀寫CSV文件中的數據
6.5.3 pandas讀寫Excel文件中的數據
6.5.4 pandas讀寫HTML文件中的數據
6.5.5 pandas讀寫JSON數據
6.5.6 pandas讀寫數據庫文件的數據
6.6 pandas數據分析處理
6.6.1 缺失值處理
6.6.2 數據合並和級聯
6.6.3 字符串和文本數據處理
6.6.4 數據排序與分組
6.6.5 pandas函數應用
6.6.6 數據統計與匯總
6.7 pandas數據分析案例
6.8 課後習題
6.9 實驗
第7章 數據建模與數據挖掘
7.1 數據建模
7.2 相關性與關聯規則
7.3 回歸分析
7.3.1 線性回歸
7.3.2 邏輯回歸
7.4 聚類
7.4.1 K-Means聚類算法
7.4.2 層次聚類算法
7.4.3 基於密度的聚類算法
7.5 分類
7.5.1 決策樹分類算法
7.5.2 樸素貝葉斯分類算法
7.5.3 支持向量機(SVM)的分類算法
7.5.4 K-最近鄰算法
7.6 課後習題
7.7 實驗
第8章 數據可視化
8.1 Matplotlib
8.1.1 認識Matplotlib
8.1.2 圖形的屬性
8.1.3 Matplotlib繪圖流程
8.1.4 基本圖表繪制
8.1.5 高級圖表繪制
8.1.6 子圖繪制
8.2 PyEcharts
8.2.1 認識PyEcharts
8.2.2 圖表繪制
8.3 seaborn
8.3.1 認識seaborn
8.3.2 圖表繪制
8.4 課後習題
8.5 實驗
第9章 綜合案例
9.1 二手房數據分析
9.1.1 數據獲取
9.1.2 數據清洗與數據轉換
9.1.3 數據分析
9.1.4 數據可視化
9.1.5 數據分析結果
9.2 旅遊景點數據分析
9.2.1 爬