Python 網絡爬蟲技術與實戰
趙國生 王 健 編著
- 出版商: 機械工業
- 出版日期: 2021-01-01
- 定價: $534
- 售價: 8.5 折 $454
- 語言: 簡體中文
- 頁數: 458
- 裝訂: 平裝
- ISBN: 7111674111
- ISBN-13: 9787111674115
-
相關分類:
Web-crawler 網路爬蟲
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$354R語言入門與實踐 -
$374零基礎學 Python -
精通 Nginx, 2/e ( Mastering NGINX, 2/e)$354$336 -
$469R語言入門經典 -
$654R語言之書 編程與統計 -
$301Scrapy 網絡爬蟲實戰 -
R語言數據可視化之美:專業圖表繪制指南 (增強版)$954$906 -
$352概率、決策與博弈: 基於R語言介紹 (Probability, Decisions and Games: A Gentle Introduction Using R) -
Python 神乎其技 全新超譯版 - 快速精通 Python 進階功能, 寫出 Pythonic 的程式 (Python Tricks: A Buffet of Awesome Python Features)$580$493 -
跟著阿才學 Python - 從基礎到網路爬蟲應用$450$356 -
$254Python 爬蟲開發實戰教程 -
文本探勘:小技術大應用 (附範例光碟)$350$315 -
$454ECharts 數據可視化:入門、實戰與進階 -
$426零基礎學 Python 爬蟲、數據分析與可視化從入門到精通 -
從零開始學 Selenium 自動化測試:基於 Python:視頻教學版$594$564 -
$403Selenium 自動化測試實戰 -- 基於 Python -
$505Selenium 自動化測試完全指南 -- 基於 Python -
$454數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow -
$458零基礎學 Python 網絡爬蟲案例實戰全流程詳解.高級進階篇 -
$505零基礎學Python網絡爬蟲案例實戰全流程詳解 : 入門與提高篇 -
Python 網路爬蟲:大數據擷取、清洗、儲存與分析 -- 王者歸來, 2/e$750$593 -
$839Python3 網絡爬蟲開發實戰, 2/e -
$505統計建模與 R軟件, 2/e -
從 AI 到 生成式 AI:40個零程式的實作體驗,培養新世代人工智慧素養$560$442 -
精確掌握 AI 大趨勢!深度學習技術解密:日本 AI 神人,帶你正確學會從機器學習到生成式 AI 的核心基礎$630$498
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書是一本系統、全面地介紹Python網絡爬蟲的實戰寶典。
作者融合自己豐富的工程實踐經驗,緊密結合演示應用案例,內容覆蓋了幾乎所有網絡爬蟲涉及的核心技術。
在內容編排上,一步步地剖析算法背後的概念與原理,提供大量簡潔的代碼實現,助你從零基礎開始編程實現深度學習算法。
全書按照學習爬蟲所涉及的核心技術從易到難,再到應用的順序分為14章。
第1章介紹Python的安裝配置和基礎語法。
第2章介紹爬蟲類型、抓取策略以及網絡基礎知識。
第3章介紹Python常用庫。
第4章介紹正則表達式的語法、匹配規則。
第5章講解PIL庫、Tesseract庫和TensorFlow庫的語法、類型和識別方法。
第6章介紹抓包利器Fiddler。
第7章介紹數據存儲。
第8章介紹Scrapy爬蟲框架。
第9章介紹多線程爬蟲。
第10章介紹動態網頁爬蟲。
第11章介紹分佈式爬蟲。
第12章介紹電商網站商品信息爬蟲項目。
第13章介紹生活娛樂點評類信息爬蟲。
第14章介紹圖片信息類爬蟲項目。
作者簡介
趙國生
哈爾濱師範大學教授,工學博士,碩士生導師,黑龍江省網絡安全技術領域特殊人才。
主要從事可信網絡、入侵容忍、認知計算、物聯網安全等方向的教學與科研工作。
擔任中國計算機學會容錯專委會委員、黑龍江省計算機學會網絡專委會委員、中國青年博士論壇網絡專委會委員、
國家自然科學基金委項目評審專家、黑龍江省國資採購專家組成員、黑龍江省財政廳及黑龍江省高等法院信息化資訊專家、
黑龍江省教育廳行業信息系統安全專題培訓講師、中國計算機學會高級會員、中國計算機學會YOCSEF哈爾濱副主席。
榮獲哈爾濱師範大學“先進工作者”“五四青年獎章”“寧齊堃”教學名師等榮譽。
主持國家自然科學基金、黑龍江省自然科學基金、黑龍江省科技廳科技攻關等項目10項,發表SCI/EI檢索論文50餘篇,
發明專利2項、實用新型專利6項,擁有軟件著作權6項,獲省/部級科技進步一等獎2項、三等獎1項,
撰寫《Linux操作系統原理與應用》《Matlab數學建模與模擬》《Matlab完全學習手冊》《精通Labivew》等編著6部。
目前擔任《電子學報》《通信學報》《系統模擬學報》等期刊審稿專家。
目錄大綱
目錄
前言
第1章Python環境搭建及基礎學習
1.1 Python 3.6的安裝與配置
1.1.1 Windows下的安裝
1.1.2 Linux下的安裝
1.1.3 macOS下的安裝
1. 2 IDE工具:PyCharm的安裝
1.3基礎語法
1.3.1第一個Python程序
1.3.2 Python命名規範
1.3.3行和縮進
1.3.4註釋和續行
1. 3.5 Python輸出
1.4字符串
1.4.1字符串運算符
1.4.2字符串內置函數
1.5數據結構
1.5.1列表
1.5.2元組
1.5. 3集合
1.5.4字典
1.6控制語句
1.6.1條件表達式
1.6.2選擇結構
1.6.3循環結構
1.7函數、模塊和包
1.7.1函數
1 .7.2模塊
1.7.3包
1.8文件的讀寫操作
1.8.1文件讀寫步驟與打開模式
1.8.2文件的基本操作
1.8.3文件寫入操作
1 .9面向對象
1.9.1類和對象
1.9.2封裝性
1.9.3繼承性
1.9.4多態性
1.10本章小結
練習題
第2章爬蟲原理和網絡基礎
2.2爬蟲的意義
2.3爬蟲的原理
2 .4爬蟲技術的類型
2.4.1聚焦爬蟲技術
2.4.2通用爬蟲技術
2.4.3增量爬蟲技術
2.4.4深層網絡爬蟲技術
2.5爬蟲抓取策略
2.5 .1深度優先遍歷策略
2.5.2廣度優先遍歷策略
2.5.3 PartialPageRank策略
2.5.4大站優先策略
2.5.5反向鏈接數策略
2.5.6 0PIC策略
2. 6反爬蟲和反反爬蟲
2.6.1反爬蟲
2.6.2反反爬蟲
2.7網絡基礎
2.7.1網絡體系結構
2.7.2網絡協議
2.7.3 Socket編程
2 .8本章小結
練習題
第3章Python常用庫
3.1 Python庫的介紹
3.1.1常用標準庫
3.1.2安裝使用第三方庫
3.2 urllib庫
3.2.1 urlopen()函數用法
3.2.2 urlretrieve()函數用法
3.2.3 URL編碼和URL解碼
3.2.4 urlparse0和urlsplit()數用法
3.3 request庫
3.3.1 request庫的基本使用
3.3 .2 request庫的高級用法
3.4 lxml庫
3.4.1 lxml庫的安裝和使用
3.4.2 XPath介紹
3.4.3 XPath語法
3.4.4 lxml和XPath的結合使用
3. 5 BeautifuISoup庫
3.5.1 Beautiful Soup庫的安裝和使用
3.5.2提取數據
3.5.3 CSS選擇器
3.6實戰案例
3.6.1使用Beautiful Soup解析網頁
3.6.2微信公眾號爬蟲
3.6.3爬取豆瓣讀書TOP500
3.6.4使用urllib庫爬取百度貼吧
3.7本章小結
練習題
……
第4章正則表達式
第5章驗證碼
第6章抓包利器Fiddler
第7章數據存儲
第8章Scrapy爬蟲框架
第9章多線程爬蟲
第10章動態網頁爬蟲
第11章分佈式爬蟲
第12章電商站商品信息爬蟲項目
第13章生活娛樂點評類信息爬蟲項目
第14章圖片信息類爬蟲項目
練習題答案
