Hadoop 技術手冊, 4/e (Hadoop: The Definitive Guide, 4/e)
Tom White 著,林峰正、王耀聰、辜文元、施赬陽、周天穎 譯
- 出版商: 歐萊禮
- 出版日期: 2016-09-14
- 定價: $980
- 售價: 7.9 折 $774
- 語言: 繁體中文
- ISBN: 9864761366
- ISBN-13: 9789864761364
-
相關分類:
Hadoop
- 此書翻譯自: Hadoop: The Definitive Guide, 4/e (Paperback)
已絕版
買這商品的人也買了...
-
HBase 技術手冊 (HBase: The Definitive Guide)$880$695 -
Spring Data 技術手冊 (Spring Data)$580$458 -
Hadoop 管理手冊 (Hadoop Operations)$580$493 -
It's Django -- 用 Python 迅速打造 Web 應用$400$340 -
精通 Python|運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)$780$616 -
資料科學的商業運用 (Data science for business)$680$537 -
Docker 錦囊妙計 (Docker Cookbook)$680$537 -
Python 機器學習 (Python Machine Learning)$580$452 -
Spark 學習手冊 (Learning Spark: Lightning-Fast Big Data Analysis)$520$411 -
寫給 PM、RD 與設計師看的設計需求分析─使用者想要的應用程式都是這樣打造出來的 (Designing the Requirements: Building Applications that the User Wants and Needs)$580$458 -
機器學習 | 使用 Python 進行預測分析的基本技術$580$493 -
Python + Spark 2.0 + Hadoop 機器學習與大數據分析實戰$680$530 -
網站擷取|使用 Python (Web Scraping with Python: Collecting Data from the Modern Web)$580$458 -
Spark 大數據分析新利器─資料科學家與數據分析師非用不可的入門指南書 (Big Data Analytics with Spark: A Practitioner's Guide to Using Spark for Large Scale Data Analysis)$520$260 -
Python 自動化的樂趣|搞定重複瑣碎 & 單調無聊的工作 (中文版) (Automate the Boring Stuff with Python: Practical Programming for Total Beginners)$500$425 -
TensorFlow + Keras 深度學習人工智慧實務應用$590$460 -
寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)$390$308 -
Deep Learning|用 Python 進行深度學習的基礎理論實作$580$458 -
初探機器學習|使用 Python (Thoughtful Machine Learning with Python)$480$379 -
演算法圖鑑:26種演算法 + 7種資料結構,人工智慧、數據分析、邏輯思考的原理和應用 step by step 全圖解$450$356 -
Docker 技術入門與實戰, 3/e$534$507 -
Kafka 技術手冊|即時資料與串流處理 (Kafka: The Definitive Guide)$580$458 -
Spark 技術手冊|輕鬆寫意處理大數據 (Spark: The Definitive Guide|Big Data Processing Made Simple)$880$695 -
軟體架構原理|工程方法 (Fundamentals of Software Architecture: A Comprehensive Guide to Patterns, Characteristics, and Best Practices)$680$537 -
經理人之道:技術領袖航向成長與改變的參考指南 (The Manager's Path: A Guide for Tech Leaders Navigating Growth and Change)$480$379
商品描述
準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用Apache Hadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。
針對Hadoop 2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。
.學習基礎元件如MapReduce、HDFS及YARN。
.更深入探索MapReduce,包含開發應用程式。
.設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。
.學習兩種資料格式:Avro 的資料序列化和Parquet巢狀資料。
.使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。
.了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。
.學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。
目錄大綱
第一部分 Hadoop 基礎
chapter 1|遇見 Hadoop
chapter 2|MapReduce
chapter 3|Hadoop 分散式檔案系統
chapter 4|YARN
chapter 5|Hadoop 的 I/O
第二部分 MapReduce
chapter 6|開發 MapReduce 程式
chapter 7|MapReduce 如何運作
chapter 8|MapReduce 的類型與格式
chapter 9|MapReduce 的特性
第三部分 Hadoop 操作
chapter 10|建立一個 Hadoop 叢集
chapter 11|Hadoop 的管理
第四部分 相關專案
chapter 12|Avro
chapter 13|Parquet
chapter 14|Flume
chapter 15|Sqoop
chapter 16|Pig
chapter 17|Hive
chapter 18|Crunch
chapter 19|Spark
chapter 20|HBase
chapter 21|ZooKeeper
第五部分 案例研究
chapter 22|Cerner 的可聚集資料
chapter 23|生物資料科學:用軟體拯救生命
chapter 24|Cascading
appendix A|安裝 Apache Hadoop
appendix B|Cloudera 的Hadoop 發行套件
appendix C|準備 NCDC 氣象資料
appendix D|舊版及新版的 Java MapReduce API
index











