Python 爬蟲從菜鳥到高手

李寧

  • 出版商: 清華大學
  • 出版日期: 2023-09-01
  • 售價: $714
  • 貴賓價: 9.5$678
  • 語言: 簡體中文
  • 頁數: 460
  • 裝訂: 平裝
  • ISBN: 7302640513
  • ISBN-13: 9787302640516
  • 相關分類: Web-crawler 網路爬蟲
  • 立即出貨 (庫存 < 3)

  • Python 爬蟲從菜鳥到高手-preview-1
  • Python 爬蟲從菜鳥到高手-preview-2
  • Python 爬蟲從菜鳥到高手-preview-3
Python 爬蟲從菜鳥到高手-preview-1

買這商品的人也買了...

商品描述

本書從實戰角度系統論述了Python 爬蟲技術的核心知識,並通過大量的真實項目幫助讀者深入掌握Python 爬蟲技術及其實現。本書提供了大量實戰案例,演繹採用各種技術編寫Python 爬蟲的方式。讀者可以任意組合使用這些技術,完成非常復雜的爬蟲應用。本書共20 章,分為五篇。第一篇:基礎知識(第1~2 章),主要包括Python 編程環境的搭建、IDE 的安裝和使用、HTTP 的基礎知識、網頁基礎(HTML、CSS、JavaScript)、爬蟲的基本原理、Session、Cookie。第二篇:網絡庫(第3~5 章),主要包括網絡庫urllib、urllib3 和requests 的核心使用方法,例如,發送HTTP 請求、處理超時、設置HTTP 請求頭、處理中文字符、搭建和使用代理、解析鏈接、Robots 協議等。第三篇:解析庫(第6~9 章),主要包括3 個常用解析庫(lxml、Beautiful Soup 和pyquery)的使用方法,同時介紹了多種用於分析HTML 代碼的技術,例如,正則表達式、XPath、CSS 選擇器、方法選擇器等。第四篇:數據存儲(第10~11 章),主要包括Python 中數據存儲的解決方案,如文件存儲和SQLite 數據庫。第五篇:爬蟲高級應用(第12~20 章),主要包括Python 爬蟲的一些高級技術,如抓取異步數據、Selenium、Splash、抓取移動App 數據、Appium、多線程爬蟲、爬蟲框架Scrapy、通過OpenCV 技術識別驗證碼;最後給出一個綜合的實戰案例,該案例綜合了Python 爬蟲、數據存儲、PyQt、多線程、數據可視化、Web 等多種技術實現一個可視化爬蟲。