Python數據分析從入門到精通

李梓萌著

  • 出版商: 機械工業
  • 出版日期: 2020-05-09
  • 定價: $594
  • 售價: 6.7$399
  • 語言: 簡體中文
  • 頁數: 345
  • 裝訂: 平裝
  • ISBN: 7111649885
  • ISBN-13: 9787111649885
  • 相關分類: Data Science
  • 立即出貨

買這商品的人也買了...

商品描述

Python數據分析從入門到精通循序漸進地講解了使用Python語言實現數據分析的核心知識,
並通過具體實例的實現過程演示了數據分析的方法和流程。
Python數據分析從入門到精通共12章,內容包括Python語言基礎、
處理網絡數據、網絡爬蟲實戰、處理特殊文本格式、
使用數據庫保存數據、操作處理CSV文件、操作處理JSON數據、
使用庫matplotlib實現數據可視化處理、使用庫pygal實現數據可視化處理、
使用庫numPy實現數據可視化處理、
使用庫pandas實現數據可視化處理和大數據實戰案例。
Python數據分析從入門到精通簡潔而不失技術深度,內容豐富全面。
不僅易於閱讀,同時涵蓋了其他同類圖書中很少涉及的參考資料,
是學習Python數據分析的實用教程。
Python數據分析從入門到精通適用於已了解Python語言基礎語法、
希望進一步提高自己Python開發水平的讀者,
還可作為大中專院校和培訓學校相關專業師生的學習參考用書。

作者簡介

李梓萌

女,高級工程師,畢業於清華大學,供職於阿里巴巴淘寶事業部。
工作項目涉及金融科技、證券交易所、銀行、生物信息學、
基因組學、廣告技術、基礎設施、交通運輸、能源、
人力資源和娛樂等多個領域的數據分析工作。
在預測分析、數據科學、機器學習、大數據、產品工程、
高性能計算和雲基礎設施等項目中工作了8年。

目錄大綱

目錄
前言
第1章Python語言基礎1
1.1 Python語言介紹1
1.1.1 Python語言的地位1
1.1.2 Python語言的優點2
1.2安裝Python3
1.2.1在Windows系統中下載並安裝Python3
1.2.2在MacOS系統中下載並安裝Python6
1.2.3在Linux系統中下載並安裝Python6
1.3 Python開發工具介紹7
1.3.1使用Python自帶的開發工具IDLE7
1.3.2使用流行工具PyCharm7
1.4認識第一段Python程序11
1.4. 1使用IDLE編碼並運行11
1.4.2使用命令行方式運行Python程序12
1.4.3使用交互式方式運行Python程序12
1.4.4使用PyCharm實現第一個Python程序13

第2章處理網絡數據17
2.1處理HTML和XML數據17
2.1.1解析XML數據17
2.1.2使用庫beautiful soup解析數據25
2.1.3使用庫bleach解析數據27
2.1.4使用庫cssutils解析數據29
2.1.5使用庫html5lib解析數據31
2.1.6使用庫markupsafe解析數據31
2.1.7使用庫pyquery解析數據32
2.2處理HTTP數據34
2.2.1使用內置的http包處理數據34
2.2.2使用庫requests處理數據36
2.2.3使用庫httplib2處理數據37
2.2.4使用庫urllib3處理數據41
2.3處理URL數據44
2.3.1使用urllib包44
2.3.2使用庫furl處理數據47
2.3.3使用庫purl處理數據48
2.3.4使用庫webargs處理數據50
2.4爬取新聞保存到XML文件並分析特徵關係50
2.4.1爬蟲抓取數據51
2.4. 2使用Stanford CoreNLP提取XML數據的特徵關係52

第3章網絡爬蟲實戰54
3.1網絡爬蟲基礎54
3.2開發簡單的網絡爬蟲應用程序55
3.2.1爬蟲抓取某高校教師信息55
3.2.2抓取某吧的信息59
3.2.3抓取XX百科64
3.2.4爬蟲抓取某網站的信息並保存到本地68
3.3使用爬蟲框架Scrapy70
3.3.1 Scrapy框架基礎71
3.3.2搭建Scrapy環境72
3.3.3創建第一個Scrapy項目72
3.3.4抓取某電影網的熱門電影信息76
3.3.5抓取某網站中的照片並保存到本地81
3.3.6抓取某網站中的主播照片並保存到本地82

第4章處理特殊文本格式84
4.1使用tablib模塊84
4.1.1基本用法84
4.1.2操作數據集中的指定行和列86
4.1.3刪除並導出不同格式的數據87
4.1.4生成一個Excel文件88
4.1.5處理多個數據集89
4.1.6使用標籤過濾數據92
4.1.7分離表格中的數據92
4.2使用openpyxl處理Office文件93
4.2.1 openpyxl基礎93
4.2.2使用openpyxl讀取Excel文件的數據96
4.2.3將4組數據導入Excel文件96
4.2.4在Excel文件中檢索某關鍵字數據98
4.2.5將數據導入Excel文件並生成一個圖表99
4.3使用pyexcel處理Office文件100
4.3.1使用pyexcel讀取並寫入CSV文件100
4.3.2使用pyexcel讀取指定Excel文件中每個單元格數據101
4.3.3按列讀取並顯示指定Excel文件中每個單元格數據102
4.3.4讀取顯示Excel文件中的所有數據102
4.3.5將3組數據導入新建的Excel文件103
4.3.6以多種方式獲取Excel數據104
4.3.7將數據分別導入Excel文件和SQLite數據庫105
4.3.8在Flask Web項目中使用pyexcel處理數據106
4.4使用python-docx處理Office文件109
4.4.1使用python-docx處理Office文件的流程109
4.4.2創建Word文檔110
4.4.3在Word中插入圖片110
4.4.4創建結構文檔112
4.4.5讀取Word文檔114
4.5使用xlrd和xlwt讀寫Excel115
4.5.1使用庫xlrd115
4.5.2使用庫xlwt117
4.6使用xlsxwriter操作Excel文件118
4.6.1使用庫xlsxwriter的基本流程118
4.6.2創建一個表格118
4.6.3設置表格樣式120
4.6.4向Excel文件中插入圖像122
4.6.5向Excel文件中插入數據並繪製柱狀圖123
4.6.6向Excel文件中插入數據並繪製散點圖125
4.6. 7向Excel文件中插入數據並繪製柱狀圖和餅狀圖126

第5章使用數據庫保存數據129
5.1操作SQLite3數據庫129
5.1.1 sqlite3模塊介紹129
5.1.2使用sqlite3模塊操作SQLite3數據庫130
5.1.3使用Flask+ SQLite3+ ECharts2實現降水數據可視化系統132
5.2操作MySQL數據庫138
5.2.1搭建PyMySQL環境138
5.2.2實現數據庫連接139
5.2.3創建數據庫表140
5.2.4爬取XX站用戶信息並保存到MySQL數據庫141
5.3使用MariaDB數據庫145
5.3.1搭建MariaDB數據庫環境145
5.3.2在Python程序中使用MariaDB數據庫148
5.4使用MongoDB數據庫150
5.4.1搭建MongoDB環境150
5.4.2在Python程序中使用MongoDB數據庫151
5.5使用ORM操作數據庫154
5.5.1 Python和ORM154
5.5.2使用SQLAlchemy155
5.5.3使用mongoengine160

第6章操作處理CSV文件163
6.1內置CSV模塊介紹163
6.1.1內置成員163
6.1.2操作CSV文件165
6.1.3提取CSV數據並保存到MySQL數據庫172
6.1.4提取CSV數據並保存到SQLite數據庫176
6.2爬取圖書信息並保存為CSV文件178
6.2.1實例介紹178
6.2.2具體實現178
6.3使用CSV文件保存Scrapy抓取的數據181
6.3.1搭建Scrap