Spark 學習手冊 (Learning Spark: Lightning-Fast Big Data Analysis)

Holden Karau, Andy Konwinski, Patrick We 著，許致軒譯

預覽內頁

出版商: 歐萊禮
出版日期: 2016-09-04
定價: $520
售價: 7.9 折 $410
語言: 繁體中文
頁數: 288
ISBN: 9864760467
ISBN-13: 9789864760466
相關分類: Spark
此書翻譯自: Learning Spark: Lightning-Fast Big Data Analysis (Paperback)

立即出貨(限量) (庫存=9)

Spark 學習手冊 (Learning Spark: Lightning-Fast Big Data Analysis)-preview-1

買這商品的人也買了...

~~$620~~ $527

大話設計模式
~~$580~~ $458

Hadoop 管理手冊 (Hadoop Operations)
~~$780~~ $616

精通 Python｜運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)
~~$360~~ $284

完整學會 Git, GitHub, Git Server 的24堂課
~~$750~~ $638

大數據分析處理：Spark技術、應用與性能優質化
~~$980~~ $774

流暢的 Python｜清晰、簡潔、有效的程式設計 (Fluent Python)
$288

Scala 學習手冊
$555

Scala 程式設計, 2/e (Programming Scala: Scalability = Functional Programming + Objects, 2/e)
~~$420~~ $331

讓響應式(RWD)網頁設計變簡單：Bootstrap開發速成 (附135分鐘專題影音教學)
~~$680~~ $537

Docker 錦囊妙計 (Docker Cookbook)
~~$580~~ $458

建構微服務｜設計細微化的系統 (Building Microservices)
~~$580~~ $452

Python 機器學習 (Python Machine Learning)
~~$580~~ $290

寫給 PM、RD 與設計師看的設計需求分析─使用者想要的應用程式都是這樣打造出來的 (Designing the Requirements: Building Applications that the User Wants and Needs)
~~$980~~ $774

Hadoop 技術手冊, 4/e (Hadoop: The Definitive Guide, 4/e)
~~$680~~ $530

Python + Spark 2.0 + Hadoop 機器學習與大數據分析實戰
~~$580~~ $458

網站擷取｜使用 Python (Web Scraping with Python: Collecting Data from the Modern Web)
~~$520~~ $260

Spark 大數據分析新利器─資料科學家與數據分析師非用不可的入門指南書 (Big Data Analytics with Spark: A Practitioner's Guide to Using Spark for Large Scale Data Analysis)
~~$500~~ $425

Python 自動化的樂趣｜搞定重複瑣碎 & 單調無聊的工作 (中文版) (Automate the Boring Stuff with Python: Practical Programming for Total Beginners)
~~$360~~ $180

深度學習快速入門 — 使用 TensorFlow (Getting started with TensorFlow)
~~$580~~ $458

演算法技術手冊, 2/e (Algorithms in a Nutshell: A Practical Guide, 2/e)
~~$680~~ $537

資料視覺化｜使用 Python 與 JavaScript (Data Visualization with Python and JavaScript: Scrape, Clean, Explore & Transform Your Data)
~~$590~~ $460

TensorFlow + Keras 深度學習人工智慧實務應用
~~$390~~ $195

寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)
~~$580~~ $458

Deep Learning｜用 Python 進行深度學習的基礎理論實作
~~$500~~ $390

為你自己學 Git

商品描述

<內容介紹>

現今無論在任何領域，資料都逐漸地變大，你該如何有效率的對他們進行處理?此書介紹了Apache Spark，一個開放原始碼叢集運算系統。它使資料可以更快速的寫入以及執行。藉由Spark，你可以透過簡易的Pyhon,Java,或是Scala的API進行快速的大量資料處理。

此書為Spark的開發者親自撰寫，可以讓資料科學家以及工程師立即應用書中的知識展開工作。讀者將學會如何透過數行的程式碼進行一個平行處理的工作。本書涵蓋了基礎的批次工作到串流處理以及機器學習等相關的應用。

‧讓讀者可以快速地了解Spark，例如：分散式資料集、記憶體快取、以及交互式介面等。
‧利用Spark內建的強大資料庫，包含Spark SQL、Spark Streaming以及MLib。
‧使用一個Spark程式框架即可取代混合多種工具如Hive、Hadoop、Mahout以及Strom。
‧學習透過Spark進行交互式、批次、以及串流式的應用程式開發
‧與諸多資料來源進行連接，包含HDFS、HIVE、JSON以及S3
‧學習資料切割以及共享變數等進階議題

“本書是我在大數據處理應用程式指南推薦書單中的第一名” --Ben. Lorica資料科學家主席, O’Reilly Media

<章節目錄>
Chapter 1 Spark 資料分析導論
Chapter 2 下載及開始使用 Spark
Chapter 3 RDD程式撰寫
Chapter 4 鍵值對 RDD 操作
Chapter 5 存取資料
Chapter 6 進階 Spar k程式撰寫
Chapter 7 在叢集執行 Spark
Chapter 8 Spark 調校與除錯
Chapter 9 Spark SQL
Chapter 10 Spark streaming
Chapter 11 MLlib 機器學習函式庫