Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining (Hardcover)
暫譯: 使用 R 進行自動化數據收集:網頁爬蟲與文本挖掘的實用指南(精裝版)

Simon Munzert, Christian Rubba, Peter Meißner, Dominic Nyhuis

買這商品的人也買了...

相關主題

商品描述

A hands on guide to web scraping and text mining for both beginners and experienced users of R

  • Introduces fundamental concepts of the main architecture of the web and databases and covers HTTP, HTML, XML, JSON, SQL.
  • Provides basic techniques to query web documents and data sets (XPath and regular expressions).
  • An extensive set of exercises are presented to guide the reader through each technique.
  • Explores both supervised and unsupervised techniques as well as advanced techniques such as data scraping and text management.
  • Case studies are featured throughout along with examples for each technique presented.
  • R code and solutions to exercises featured in the book are provided on a supporting website.

商品描述(中文翻譯)

針對初學者和有經驗的 R 使用者的網頁擷取和文本挖掘實用指南


  • 介紹網路和資料庫的主要架構的基本概念,涵蓋 HTTP、HTML、XML、JSON、SQL。

  • 提供查詢網頁文件和數據集的基本技術(XPath 和正則表達式)。

  • 提供一系列廣泛的練習,以指導讀者掌握每種技術。

  • 探討監督式和非監督式技術,以及數據擷取和文本管理等進階技術。

  • 全書包含案例研究,並為每種技術提供示例。

  • 書中提到的 R 代碼和練習解答可在支援網站上獲得。