Pro Apache Hadoop, 2/e (Paperback)
暫譯: Pro Apache Hadoop, 第二版 (平裝本)

Jason Venner, Sameer Wadkar, Madhu Siddalingaiah

  • 出版商: Apress
  • 出版日期: 2014-09-09
  • 售價: $1,485
  • 貴賓價: 9.5$1,411
  • 語言: 英文
  • 頁數: 444
  • 裝訂: Paperback
  • ISBN: 1430248637
  • ISBN-13: 9781430248637
  • 相關分類: Hadoop
  • 相關翻譯: 深入理解Hadoop(原書第2版) (簡中版)
  • 立即出貨 (庫存=1)

買這商品的人也買了...

相關主題

商品描述

Pro Apache Hadoop, Second Edition brings you up to speed on Hadoop – the framework of big data. Revised to cover Hadoop 2.0, the book covers the very latest developments such as YARN (aka MapReduce 2.0), new HDFS high-availability features, and increased scalability in the form of HDFS Federations. All the old content has been revised too, giving the latest on the ins and outs of MapReduce, cluster design, the Hadoop Distributed File System, and more.

This book covers everything you need to build your first Hadoop cluster and begin analyzing and deriving value from your business and scientific data. Learn to solve big-data problems the MapReduce way, by breaking a big problem into chunks and creating small-scale solutions that can be flung across thousands upon thousands of nodes to analyze large data volumes in a short amount of wall-clock time. Learn how to let Hadoop take care of distributing and parallelizing your software—you just focus on the code; Hadoop takes care of the rest.

  • Covers all that is new in Hadoop 2.0
  • Written by a professional involved in Hadoop since day one
  • Takes you quickly to the seasoned pro level on the hottest cloud-computing framework  

What you’ll learn

  • Build a resilient and scalable Hadoop compute cluster.
  • Analyze large volumes of data in amazingly short time.
  • Optimize Hadoop tasks like a seasoned professional.
  • Implement bulletproof patterns that are proven successful.
  • Scale out using the new HDFS Federations feature set.
  • Chunk large problems into highly-parallel, MapReduce modules

Who this book is for

This book is aimed at I.T. professionals investigating Hadoop and implementing it in their organizations.  Existing Hadoop users will deepen their toolkits and come up to speed on what’s new Hadoop 2.0. New Hadoop users will quickly move to the seasoned professional level in their use of the toolset.

Table of Contents

1. Motivation for Big Data

2. Hadoop Concepts

3. Getting Started with the Hadoop Framework

4. Hadoop Administration

5. Basics of MapReduce Development

6. Advanced MapReduce Development

7. Hadoop Input Output

8. Testing Hadoop Programs

9. Monitoring Hadoop

10. Data Warehousing using Hadoop

11. Data Processing using Pig

12. HCatalog and Hadoop in the Enterprise

13. Log Analysis using Hadoop

14. Building Real-Time Systems using HBase

15. Data Science With Hadoop

16. Hadoop in the Cloud

17. Building a YARN Application

18. Appendix A

19. Appendix B

20. Appendix C

商品描述(中文翻譯)

《Pro Apache Hadoop, 第二版》讓您快速掌握 Hadoop——大數據的框架。這本書經過修訂,涵蓋了 Hadoop 2.0 的最新發展,包括 YARN(即 MapReduce 2.0)、新的 HDFS 高可用性功能,以及以 HDFS Federations 形式增強的可擴展性。所有舊內容也已修訂,提供有關 MapReduce、叢集設計、Hadoop 分散式檔案系統等的最新資訊。

本書涵蓋了建立您的第一個 Hadoop 叢集所需的一切,並開始分析和從您的商業及科學數據中獲取價值。學習如何以 MapReduce 的方式解決大數據問題,將一個大問題拆分為小塊,並創建小規模解決方案,這些解決方案可以在成千上萬的節點上分散運行,以在短時間內分析大量數據。學習如何讓 Hadoop 負責分配和並行化您的軟體——您只需專注於程式碼;Hadoop 會處理其餘的工作。

- 涵蓋 Hadoop 2.0 中的所有新功能
- 由從一開始就參與 Hadoop 的專業人士撰寫
- 快速將您提升至熱門雲計算框架的資深專業水平

您將學到的內容:
- 建立一個具韌性和可擴展的 Hadoop 計算叢集。
- 在驚人的短時間內分析大量數據。
- 像資深專業人士一樣優化 Hadoop 任務。
- 實施經過驗證的可靠模式。
- 使用新的 HDFS Federations 功能集進行擴展。
- 將大型問題拆分為高度並行的 MapReduce 模組。

本書的讀者對象:
本書針對正在調查 Hadoop 並在其組織中實施的 IT 專業人士。現有的 Hadoop 使用者將深化他們的工具包,並了解 Hadoop 2.0 的新功能。新的 Hadoop 使用者將迅速提升至資深專業人士的使用水平。

目錄:
1. 大數據的動機
2. Hadoop 概念
3. 開始使用 Hadoop 框架
4. Hadoop 管理
5. MapReduce 開發基礎
6. 高級 MapReduce 開發
7. Hadoop 輸入輸出
8. 測試 Hadoop 程式
9. 監控 Hadoop
10. 使用 Hadoop 的數據倉儲
11. 使用 Pig 的數據處理
12. HCatalog 和企業中的 Hadoop
13. 使用 Hadoop 的日誌分析
14. 使用 HBase 建立實時系統
15. 使用 Hadoop 的數據科學
16. 雲端中的 Hadoop
17. 建立 YARN 應用程式
18. 附錄 A
19. 附錄 B
20. 附錄 C