Python 網絡爬蟲 (Scrapy框架)
肖睿 陳磊
- 出版商: 人民郵電
- 出版日期: 2020-01-01
- 定價: $270
- 售價: 7.9 折 $213
- 語言: 簡體中文
- 頁數: 199
- ISBN: 7115527296
- ISBN-13: 9787115527295
-
相關分類:
Web-crawler 網路爬蟲
立即出貨
買這商品的人也買了...
-
$234統計會犯錯如何避免數據分析中的統計陷阱 -
$270Python 編程基礎與 HTTP 接口測試 -
$270Python 數字信號處理應用 (Think DSP: Digital Signal Processing in Python) -
$250Python 3爬蟲、數據清洗與可視化實戰 -
$352Python金融數據分析 -
$454統計機器學習導論 (Introduction to Statistical Machine Learning) -
$374機器學習:實用技術指南 -
Python 深度學習實作:Keras 快速上手$500$390 -
$414機器學習經典算法剖析 基於OpenCV -
$403AWS 雲計算實戰 (Amazon Web Services in Action) -
BBC Micro:bit 入門與學習$249$197 -
$768數據密集型應用系統設計 (Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems) -
$403Python Web 自動化測試設計與實現 -
$236機器學習及應用(在線實驗+在線自測) -
$594深度強化學習原理與實踐 -
$301Python 接口自動化測試 -
$607電腦時代的統計推斷:算法、演化和數據科學 (Computer Age Statistical Inference : Algorithms, Evidence, and Data Science) -
$505Python Qt GUI 與數據可視化編程 -
$559基於 Python 的金融分析與風險管理 -
$422深度學習模型及應用詳解 -
$534面向數據科學家的實用統計學 -
$232精通 Python 設計模式, 2/e (Mastering Python Design Patterns : A guide to creating smart, efficient and reusable software, 2/e) -
$450自己動手寫 Python 虛擬機 -
$571HTTP/2 in Action (簡體中文版) -
$559Python + Kivy (App開發) 從入門到實踐
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
因特網上存在著大量值得收集的公共信息,而爬蟲技術就是獲取這些公共信息的主要工具。本書以主流的Scrapy爬蟲框架為例,介紹了Python網絡爬蟲的組成、爬蟲框架的使用以及分佈式爬蟲等內容。本書運用了大量案例和實踐,融入了含金量十足的開發經驗,使得內容緊密結合實際應用。在此基礎上,本書還通過豐富的練習和操作實踐,幫助讀者鞏固所學的內容。本書配以多元的學習資源和支持服務,包括視頻、案例素材、學習社區等,為讀者提供全方位的學習體驗。
本書適合作為電腦、大數據等相關專業的教材,也適合具有一定Linux或Python開發基礎的人員閱讀,還可以作為爬蟲工程師的學慣用書。
目錄大綱
第1章 使用第三方庫實現信息抓取
任務1 使用第三方庫實現北京公交站點頁面信息抓取
1.1.1 介紹爬蟲
1.1.2 HTTP
1.1.3 HTML
1.1.4 使用第三方庫實現爬蟲功能
1.1.5 技能實訓
任務2使用第三方庫實現北京公交站點詳細信息抓取
1.2.1 lxml庫
1.2.2 第三方庫數據抓取及保存
1.2.3 技能實訓
本章小結
本章作業
第2章 初探Scrapy爬蟲框架
任務1 安裝Scrapy爬蟲框架並創建爬蟲工程
2.1.1 根據使用場景劃分爬蟲種類
2.1.2 開發基於Scrapy爬蟲框架的工程
任務2學習並掌握Scrapy爬蟲框架各模塊的功能
2.2.1 Scrapy爬蟲工程組成
2.2.2 Scrapy爬蟲框架架構
本章小結
本章作業
第3章 提取網頁數據
任務1 使用Scrapy的選擇器提取豆瓣電影信息
3.1.1 Response對象
3.1.2 css選擇器
3.1.3 多層級網頁爬取
3.1.4 技能實訓
任務2使用正則表達式從電影介紹詳情中提取指定信息
3.2.1 正則表達式
3.2.2 技能實訓
本章小結
本章作業
第4章 Scrapy數據保存(文件、MySQL、MongoDB)
任務一 使用Feed exports將爬取的電影信息保存到常見數據格式文件中
4.1.1 Feed exports
4.1.2 技能實訓
任務2使用pipeline將爬取的電影信息數據保存到數據庫中
4.2.1 Python操作MySQL數據庫
4.2.2 pipeline模塊
4.2.3 將數據保存到MongoDB中
4.2.4 技能實訓
本章小結
本章作業
第5章 Scrapy反反爬技術
任務1 學習反爬蟲和反反爬蟲策略
5.1.1 反爬蟲方法和反反爬蟲策略
5.1.2 Scrapy設置實現反反爬
5.1.3 技能實訓
任務2學習Scrapy框架中更多常用的設置
5.2.1 抓取需要登錄的網站
5.2.2 Scrapy常用擴展設置
本章小結
本章作業
第6章 Selenium+瀏覽器加載動態數據
任務一使用Selenium和第三方瀏覽器驅動完成搜狐網頁信息爬取
6.1.1 靜態網頁與動態網頁
6.1.2 爬蟲抓取動態網頁的常用方法
6.1.3 Selenium+Chrome driver
6.1.4 技能實訓
任務二使用Selenium+Chrome+Scrapy完成京東商品信息爬取
6.2.1 Selenium的使用
6.2.2 Selenium提高效率的方法
6.2.3 技能實訓
本章小結
本章作業
第7章 App數據爬取
任務一使用Scrapy爬蟲框架爬取雪球App基金頻道新聞列表數據
7.1.1 App數據爬取介紹
7.1.2 App數據接口分析方法
7.1.3 使用Scrapy爬取App數據
7.1.4 技能實訓
任務2使用Scrapy爬巴蟲框架爬取知乎App推薦欄目列表數據
7.2.1 爬取使用證書校驗技術的App數據
7.2.2 技能實訓
本章小結
本章作業
第8章 分布式爬蟲Scrapy-Redis
任務1搭建分布式爬蟲運行環境
8.1.1 分布式爬蟲框架介紹
8.1.2 搭建分布式爬蟲運行環境
任務2 使用分布式爬蟲完成對火車信息的爬取
8.2.1 Scrapy-Redis分布式爬蟲
8.2.2 技能實訓
本章小結
本章作業
第9章 Python數據分析
任務1 使用:Pandas統計招聘信息中城市名稱出現的次數
9.1.1 Python數據分析
9.1.2 NumPy
9.1.3 Pandas
9.1.4 技能實訓
任務2使用Matplotlib實現招聘信息中城市名稱出現次數的可視化展示
9.2.1 數據可視化
9.2.2 技能實訓
本章小結
本章作業
第10章 項目實訓——爬取招聘網站數據
10.1 項目準備
lO.2 難點分析
10.3 項目實現思路
本章小結
本章作業


