Spark 高級數據分析 Spark高级数据分析
里扎 (Sandy Ryza), Uri Laserson, Sean Owen, Josh Wills
已絕版
買這商品的人也買了...
-
$580$452 -
$780$663 -
$450$351 -
$454Python 自然語言處理 (Natural Language Processing with Python)
-
$780$616 -
$380$323 -
$345$328 -
$528$502 -
$520$442 -
$301Spark 快速大數據分析
-
$238$226 -
$301Python網絡數據採集
-
$288$274 -
$301Spark 機器學習 (Machine Learning with Spark)
-
$654$621 -
$383Spark核心源碼分析與開發實戰
-
$348$331 -
$294$279 -
$490$382 -
$607Scala 編程實戰
-
$490$294 -
$520$442 -
$400$312 -
$500$390 -
$699$489
商品描述
<內容簡介>
本書是使用Spark進行大規模數據分析的實戰寶典,由大數據公司Cloudera的數據科學家撰寫。四位作者首先結合數據科學和大數據分析的廣闊背景講解了Spark,然後介紹了用Spark和Scala進行數據處理的基礎知識,接著討論瞭如何將Spark用於機器學習,同時介紹了常見應用中幾個常用的算法。此外還收集了一些更加新穎的應用,比如通過文本隱含語義關係來查詢Wikipedia或分析基因子據。
<作者簡介>
Sandy Ryza是Cloudera公司數據科學家,Apache Spark項目的活躍代碼貢獻者。領導了Cloudera公司的Spark開發工作。他還是Hadoop項目管理委員會委員。
Uri Laserson是Cloudera公司數據科學家,專註於Hadoop生態系統中的Python部分。
Sean Owen是Cloudera公司EMEA地區的數據科學總監,也是Apache Spark項目的代碼提交者。他創立了基於Spark、Spark Streaming和Kafka的Hadoop實時大規模學習項目Oryx(之前稱為Myrrix)。
Josh Wills是Cloudera公司的高級數據科學總監,Apache Crunch項目的發起者和副總裁。