Hadoop大數據平臺構建
孟瑞軍、哈里白、高榮貴、宋海燕
- 出版商: 清華大學
- 出版日期: 2024-12-01
- 定價: $348
- 售價: 8.5 折 $296
- 語言: 簡體中文
- ISBN: 7302677158
- ISBN-13: 9787302677154
-
相關分類:
Hadoop、大數據 Big-data
下單後立即進貨 (約4週~6週)
商品描述
" 本書以Hadoop 及其周邊框架為主線,介紹了整個Hadoop 生態系統主流的大數據組件以及平臺運維。本書從零開始逐一講解大數據體系中的各種技術,通過豐富的實戰案例闡述重點、難點知識,為初學者進入大數據領域打好基礎。書中各個項目設計合理,在每個項目開頭設置導讀,首先介紹知識點,然後緊跟實踐操作,最後在每個項目末尾通過課後練習幫助讀者鞏固所學知識。 本書既可作為Hadoop 新手入門的指導用書,也可作為職業院校大數據技術、雲計算應用技術和人工智能應用技術等電腦類專業的教材,還可供從事電腦相關工作的技術人員參考。"
目錄大綱
目 錄
項目1 大數據及Hadoop 概述 …………………………………………………………… 1
任務1.1 大數據概述 ……………………………………………………………………… 2
任務1.2 Hadoop 概述 …………………………………………………………………… 5
課後練習 ………………………………………………………………………………… 8
項目2 Hadoop 分佈式集群安裝及部署 …………………………………………………10
任務2.1 Linux 系統基礎環境安裝及配置 ………………………………………………11
任務2.2 偽分佈式系統安裝 ………………………………………………………………22
任務2.3 完全分佈系統安裝 ………………………………………………………………33
課後練習 ………………………………………………………………………………… 47
項目3 分佈式文件系統HDFS ……………………………………………………………49
任務3.1 HDFS 概述 ………………………………………………………………………50
任務3.2 HDFS 命令行客戶端 ……………………………………………………………54
課後練習 ………………………………………………………………………………… 62
項目4 分佈式計算框架MapReduce ………………………………………………………64
任務4.1 認識MapReduce ………………………………………………………………65
任務4.2 分佈式資源調度平臺Yarn ………………………………………………………72
課後練習 ………………………………………………………………………………… 77
項目5 分佈式協調框架ZooKeeper ………………………………………………………79
任務5.1 認識ZooKeeper …………………………………………………………………80
Hadoop 大數據平臺構建
Ⅳ
任務5.2 部署ZooKeeper 集群 ……………………………………………………………86
任務5.3 ZooKeeper Shell …………………………………………………………………93
課後練習 ………………………………………………………………………………… 97
項目6 Hadoop 高可用集群 ………………………………………………………………99
任務6.1 認識Hadoop 高可用 ………………………………………………………… 100
任務6.2 部署Hadoop HA 集群 ……………………………………………………… 103
課後練習 ……………………………………………………………………………… 117
項目7 分佈式存儲數據庫HBase ……………………………………………………… 119
任務7.1 初識HBase …………………………………………………………………… 120
任務7.2 部署HBase 集群 ……………………………………………………………… 125
任務7.3 HBase Shell 操作 …………………………………………………………… 131
課後練習 ……………………………………………………………………………… 138
項目8 數據倉庫Hive …………………………………………………………………… 140
任務8.1 Hive 簡介 ……………………………………………………………………… 141
任務8.2 Hive 安裝部署 ………………………………………………………………… 146
任務8.3 Hive 操作 ……………………………………………………………………… 156
任務8.4 Hive 和HBase 整合 ………………………………………………………… 167
課後練習 ……………………………………………………………………………… 170
項目9 數據遷移工具Sqoop …………………………………………………………… 172
任務9.1 部署Sqoop …………………………………………………………………… 173
任務9.2 Sqoop 應用 …………………………………………………………………… 178
課後練習 ……………………………………………………………………………… 186
項目10 日誌採集工具Flume …………………………………………………………… 188
任務10.1 認識Flume …………………………………………………………………… 189
任務10.2 Flume 安裝部署 ……………………………………………………………… 193
任務10.3 Flume 多點採集數據 ………………………………………………………… 200
課後練習 ……………………………………………………………………………… 205
目 錄
V
目 錄
項目11 分佈式消息隊列Kafka ………………………………………………………… 207
任務11.1 認識Kafka …………………………………………………………………… 208
任務11.2 部署Kafka 集群 …………………………………………………………… 212
任務11.3 Kafka 和Flume 整合 ……………………………………………………… 219
課後練習 ……………………………………………………………………………… 221
項目12 內存計算框架Spark …………………………………………………………… 223
任務12.1 認識Spark …………………………………………………………………… 224
任務12.2 部署Spark …………………………………………………………………… 228
課後練習 ……………………………………………………………………………… 234
項目13 內存計算框架Flink …………………………………………………………… 237
任務13.1 認識Flink …………………………………………………………………… 238
任務13.2 部署Flink …………………………………………………………………… 243
課後練習 ……………………………………………………………………………… 255
項目14 大數據平臺的管理與監控 ……………………………………………………… 257
任務14.1 大數據平臺的管理與監控概述 …………………………………………… 258
任務14.2 Nagios 監控 ………………………………………………………………… 259
任務14.3 Ganglia 監控 ………………………………………………………………… 279
任務14.4 Prometheus 監控 …………………………………………………………… 297
課後練習 ……………………………………………………………………………… 306
參考文獻 …………………………………………………………………………………… 308