Pandas 通關實戰

黃福星

  • 出版商: 清華大學
  • 出版日期: 2022-08-01
  • 定價: $714
  • 售價: 8.5$607
  • 語言: 簡體中文
  • ISBN: 7302600619
  • ISBN-13: 9787302600619
  • 相關分類: Python程式語言Data Science
  • 立即出貨 (庫存 < 4)

  • Pandas 通關實戰-preview-1
  • Pandas 通關實戰-preview-2
  • Pandas 通關實戰-preview-3
Pandas 通關實戰-preview-1

買這商品的人也買了...

商品描述

本書系統闡述了Pandas基礎知識、應用原理,以及應用流程和應用技巧等實戰知識。 全書共分為5篇:第一篇為入門篇(第1和2章),第二篇為基礎篇(第3和4章),第三篇為基礎強化篇(第5~7章),第四篇為進階篇(第8~11章), 第五篇為案例篇(第12章)。書中主要內容包括Python簡介、NumPy基礎、Pandas入門、數據篩選、數據轉換、文本轉換、數據獲取、數據處理、數據分組、時序分析、數據可視化、通關案例。 本書可作為Python數據分析的入門與進階書籍,適用於有一定Python基礎的讀者、對數據分析感興趣的學生,也可作為數據分析及其它編程愛好者、IT培訓機構的參考書籍。

目錄大綱

 

 

目錄

第1篇入門篇

 

第1章Python簡介

 

1.1Pandas簡介

 

1.2Pandas數據分析

 

1.3Jupyter與Anaconda

 

1.4Anaconda、conda與pip

 

1.4.1Anaconda

 

1.4.2conda

 

1.4.3Anaconda與conda

 

1.5Anaconda的下載與安裝

 

1.6Anaconda安裝簡介

 

1.6.1安裝步驟

 

1.6.2Anaconda Navigator簡介

 

1.6.3Anaconda Prompt使用簡介

 

1.6.4Anaconda Navigator與Anaconda Prompt

 

1.6.5conda與pip

 

1.6.6Nbextensions

 

1.7Jupyter Notebook簡介

 

1.7.1代碼模式

 

1.7.2Markdown模式

 

1.8Jupyter Notebook快捷鍵簡介

 

1.9本章回顧

 

第2章NumPy基礎

 

2.1對象、數據、數組

 

2.1.1位與字節

 

2.1.2對象

 

2.1.3數組

 

2.2數組的創建方式

 

2.2.1ndarray

 

2.2.2np.array()

 

2.2.3np.arange()

 

2.2.4np.linspace()

 

2.2.5np的特殊函數

 

2.3數據的基本屬性

 

2.3.1NumPy數組屬性

 

2.3.2改變數組的形狀

 

2.3.3數組堆疊與分割

 

2.3.4廣播機制

 

2.4通用函數(ufunc)

 

2.4.1排序函數

 

2.4.2一元函數

 

2.4.3多元函數

 

2.4.4數學函數

 

2.4.5隨機函數

 

2.4.6字符串函數

 

2.4.7條件操作

 

2.4.8高階操作

 

2.5本章回顧

 

 

第2篇基礎篇

 

 

第3章Pandas入門

 

3.1Series

 

3.1.1Series基礎知識

 

3.1.2Series的構建

 

3.1.3Series的常用轉換方法 

 

3.1.4Series的“十八招”

 

3.2DataFrame

 

3.2.1DataFrame基礎知識

 

3.2.2創建

 

3.2.3DataFrame相關知識

 

3.3本章回顧

 

第4章數據篩選

 

4.1Python基礎

 

4.1.1運算符

 

4.1.2視圖與復制

 

4.1.3常用操作

 

4.2條件表達式

 

4.2.1條件篩選(索引)

 

4.2.2條件查詢

 

4.2.3條件賦值

 

4.3數據刪除

 

4.3.1缺失值

 

4.3.2重復值

 

4.3.3異常值

 

4.4數據重組

 

4.4.1填充

 

4.4.2重排

 

4.5axis轉換

 

4.5.1rename()

 

4.5.2rename_axis()

 

4.5.3reindex()

 

4.5.4reset_index()

 

4.5.5set_index()

 

4.5.6MultiIndex()

 

4.6本章回顧

 

 

第3篇基礎強化篇

 

 

第5章數據轉換

 

5.1基礎知識

 

5.1.1程序結構

 

5.1.2循環語句

 

5.2映射函數

 

5.2.1map()

 

5.2.2apply()

 

5.2.3applymap()

 

5.3各類轉換

 

5.3.1數據類型轉換

 

5.3.2數據結構轉換

 

5.3.3文本格式轉換

 

5.3.4style樣式轉換

 

5.4本章回顧

 

第6章文本轉換

 

6.1文本字符串

 

6.1.1文本基礎

 

6.1.2應用流程

 

6.2Python字符串

 

6.2.1識別階段(Identity)

 

6.2.2清洗階段(Elimilate)

 

6.2.3組合階段(Combine)

 

6.2.4轉換重組(Rearrange)

 

6.3正則表達式

 

6.3.1元字符

 

6.3.2用法

 

6.4Pandas的方法

 

6.4.1識別階段(Identity)

 

6.4.2轉換重組(Rearrange)

 

6.5本章回顧

 

第7章數據獲取

 

7.1讀取數據源

 

7.1.1pd.read_excel()

 

7.1.2pd.ExcelFile.parse()

 

7.1.3pd.read_csv()

 

7.2存儲數據

 

7.2.1df.to_excel()

 

7.2.2pd.ExcelWriter()

 

7.2.3共性總結

 

7.3追加與合並

 

7.3.1(常規)追加

 

7.3.2追加(append)

 

7.3.3合並(combine)

 

7.3.4連接(join)

 

7.3.5按軸向合並(concat)

 

7.3.6融合(merge)

 

7.4文檔的批量操作

 

7.4.1批量合並同一文件夾中的workbook

 

7.4.2批量合並同一文件工作簿中的worksheet

 

7.4.3批量更改DataFrame中的列名

 

7.4.4批量拆分DataFrame

 

7.5與xlwings的互動

 

7.5.1創建新工作簿

 

7.5.2批量修改電子表格名稱

 

7.5.3在新增電子表格中插入圖表

 

7.6本章回顧

 

 

第4篇進階篇

 

 

第8章數據處理

 

8.1統計學基礎

 

8.1.1概率與數理統計

 

8.1.2數據的離散化

 

8.1.3四則運算

 

8.2數據操作

 

8.3DataFrame處理

 

8.3.1Pandas的方法鏈

 

8.3.2assign()

 

8.3.3eval()

 

8.3.4pipe管道

 

8.4本章回顧

 

第9章數據分組

 

9.1Split階段

 

9.1.1by參數

 

9.1.2axis參數

 

9.1.3level參數

 

9.1.4as_index參數

 

9.1.5dropna參數

 

9.2Apply階段

 

9.2.1直接聚合

 

9.2.2agg

 

9.2.3map

 

9.2.4apply

 

9.2.5transform

 

9.2.6filter

 

9.3透視表

 

9.4進階應用

 

9.4.1assign

 

9.4.2pipe管道

 

9.5批量保存分組對象

 

9.5.1保存為同一文件夾內的多個工作簿

 

9.5.2保存為同一工作簿中的多個工作表

 

9.5.3保存為多個工作簿中的多個工作表

 

9.6本章回顧

 

第10章時間序列

 

10.1Excel時間函數

 

10.2datetime模塊

 

10.2.1date類

 

10.2.2time類

 

10.2.3datetime類

 

10.2.4timedelta類

 

10.3時間點

 

10.3.1pd.to_datetime

 

10.3.2pd.Timestamp

 

10.3.3DatetimeIndex時間戳索引

 

10.3.4pd.date_range()

 

10.4時間段

 

10.4.1Period

 

10.4.2Period_range

 

10.4.3asfreq時期的頻率轉換

 

10.4.4Timestamp與Period互相轉換

 

10.5時間差

 

10.5.1運算規則說明

 

10.5.2參數的傳遞方式

 

10.6重採樣

 

10.6.1使用方法

 

10.6.2降採樣

 

10.6.3升採樣和插值

 

10.6.4其他採樣

 

10.7偏移

 

10.7.1shift()

 

10.7.2diff()

 

10.7.3rolling()

 

10.8本章回顧

 

第11章數據可視化

 

11.1可視化

 

11.1.1可視化基礎

 

11.1.2可視化圖形

 

11.2Matplotlib

 

11.2.1基本語法

 

11.2.2可視化的應用流程

 

11.2.3圖表的選擇與應用

 

11.3df.plot()

 

11.3.1參數對照表

 

11.3.2應用說明

 

11.4Seaborn

 

11.4.1設置

 

11.4.2圖表應用

 

11.5本章回顧

 

11.5.1本章內容回顧

 

11.5.2時序數據圖表化

 

 

第5篇案例篇

 

 

第12章實戰案例分析

 

12.1項目說明

 

12.1.1行業描述

 

12.1.2項目背景

 

12.1.3項目推行計劃

 

12.1.4KPI指標體系

 

12.2數據現狀

 

12.2.1數據來源說明

 

12.2.2獲取數據

 

12.2.3數據轉換

 

12.3數據探索

 

12.3.1客戶訂單量

 

12.3.2業務的相關性

 

12.3.3訂單消費額

 

12.3.4探索性挖掘

 

12.3.5盈利情況

 

12.4數據分析結論

 

12.4.1數據質量現狀

 

12.4.2後續改善要求

 

12.4.3指導意見

 

12.4.4方法論整理