利用 Python 進行數據分析 (Python for Data Analysis)

麥金尼 (Wes McKinney)

買這商品的人也買了...

相關主題

商品描述

<內容簡介>

由於作者麥金尼是pandas庫的主要作者,所以本書也可以作為利用Python實現數據密集型應用的科學計算實踐指南。《利用Python進行數據分析》適合剛剛接觸Python的分析人員以及剛剛接觸科學計算的Python程序員。將IPython這個交互式Shell作為你的首要開發環境。
    《利用Python進行數據分析》:
    學習NumPy(NumericalPython)的基礎和高級知識。
    從pandas庫的數據分析工具開始。
    利用高性能工具對數據進行加載、清理、轉換、合併以及重塑。
    利用matpIotlib創建散點圖以及靜態或交互式的可視化結果。
    利用pandas的groupby功能對數據集進行切片、切塊和匯總操作。
    處理各種各樣的時間序列數據。
    通過詳細的案例學習如何解決Web分析、社會科學、金融學以及經濟學等領域的問題。

<目錄>

第1章 準備工作
  本書主要內容 
  為什麼要使用Python進行數據分析
  重要的Pvthon庫 
  安裝和設置 
  社區和研討會 
  使用本書 
  致謝
第2章 引言
  來自bit.1y的1usagov數據 
  MovieLens 1M數據集 
  1880一2010年間全美嬰兒姓名 
  小結及展望
第3章 IPython:一種交互式計算和開發環境
  IPvthon基礎   
  內省
  使用命令歷史 
  與操作系統交互 
  軟件開發工具 
  IPython HTML NOtebOOk 
  利用IPython提高代碼開發效率的幾點提示
  高級IPython功能 
  致謝   
第4章 NumPy基礎:數組和矢量計算
  NumPy的ndarray:一種多維數組對象     
  通用函數快速的元素級數組函數   
  利用數組進行數據處理
  用於數組的文件輸入輸出
  線性代數   
  隨機數生成 
  範例:隨機漫步
第5章 pandas入f]
  pandas的數據結構介紹
  基本功能 
  匯總和計算描述統計
  處理缺失數據
  層次化索引   
  其他有關Pandas的話題     
第6章 數據加載、存儲與文件格式
  讀寫文本格式的數據
  二進制數據格式
  使用HTML和web API
  使用數據庫
第7章 數據規整化:清理、轉換、合併、重塑
  合併數據集 
  重塑和軸向旋轉
  數據轉換
  字符串操作         
  示例usDA食品數據庫 
第8章 繪圖和可視化
  matDlotlib API入門
  pandas中的繪圖函數   
  繪製地圖  圖形化顯示海地地震危機數據
  Python圖形化工具生態系統 
第9章 數據聚合與分組運算
  GroupBy技術 
  數據聚合     
  分組級運算和轉換
  透視表和交叉表
  示例:2012聯邦選舉委員會數據庫
第10章 時間序列
  日期和時間數據類型及工具
  時間序列基礎
  日期的範圍頻率以及移動
  時區處理
  時期及其算術運算   
  重採樣及頻率轉換
  時間序列繪圖     
  移動窗口函數
  性能和內存使用方面的註意事項   
第11章 金融和經濟數據應用
  數據規整化方面的話題
  分組變換和分析   
  更多示例應用
第12章 NumPy高級應用
  ndarray對象的內部機理   
  高級數組操作
  廣播   
  ufunc高級應用
  結構化和記錄式數組 
  更多有關排序的話題
  NumPy的matrix類
  高級數組輸入輸出 
  性能建議 
附錄A Python語言精要