精通 Python 爬蟲框架 Scrapy (Learning Scrapy)

[美]迪米特裡奧斯 考奇斯-勞卡斯

買這商品的人也買了...

商品描述

Scrapy是使用Python開發的一個快速、高層次的屏幕抓取和Web抓取框架,用於抓Web站點並從頁面中提取結構化的數據。《精通Python爬蟲框架Scrapy》以Scrapy 1.0版本為基礎,講解了Scrapy的基礎知識,以及如何使用Python和三方API提取、整理數據,以滿足自己的需求。
本書共11章,其內容涵蓋了Scrapy基礎知識,理解HTML和XPath,安裝Scrapy並爬取一個網站,使用爬蟲填充數據庫並輸出到移動應用中,爬蟲的強大功能,將爬蟲部署到Scrapinghub雲服務器,Scrapy的配置與管理,Scrapy編程,管道秘訣,理解Scrapy性能,使用Scrapyd與實時分析進行分佈式爬取。本書附錄還提供了各種軟件的安裝與故障排除等內容。
本書適合軟件開發人員、數據科學家,以及對自然語言處理和機器學習感興趣的人閱讀。