Spark 高級數據分析 Spark高级数据分析

里扎 (Sandy Ryza), Uri Laserson, Sean Owen, Josh Wills

  • 出版商: 人民郵電
  • 出版日期: 2015-11-01
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • 頁數: 226
  • 裝訂: 平裝
  • ISBN: 7115404747
  • ISBN-13: 9787115404749
  • 相關分類: Spark資料科學

已絕版

買這商品的人也買了...

商品描述

<內容簡介>

  本書是使用Spark進行大規模數據分析的實戰寶典,由大數據公司Cloudera的數據科學家撰寫。四位作者首先結合數據科學和大數據分析的廣闊背景講解了Spark,然後介紹了用Spark和Scala進行數據處理的基礎知識,接著討論瞭如何將Spark用於機器學習,同時介紹了常見應用中幾個常用的算法。此外還收集了一些更加新穎的應用,比如通過文本隱含語義關係來查詢Wikipedia或分析基因子據。

<作者簡介>

  Sandy Ryza是Cloudera公司數據科學家,Apache Spark項目的活躍代碼貢獻者。領導了Cloudera公司的Spark開發工作。他還是Hadoop項目管理委員會委員。

  Uri Laserson是Cloudera公司數據科學家,專註於Hadoop生態系統中的Python部分。

  Sean Owen是Cloudera公司EMEA地區的數據科學總監,也是Apache Spark項目的代碼提交者。他創立了基於Spark、Spark Streaming和Kafka的Hadoop實時大規模學習項目Oryx(之前稱為Myrrix)。

  Josh Wills是Cloudera公司的高級數據科學總監,Apache Crunch項目的發起者和副總裁。