基於 Apache Kylin 構建大數據分析平臺 基于Apache Kylin构建大数据分析平台

蔣守壯

買這商品的人也買了...

商品描述

<內容簡介>

Apache Kylin是一個開源的分佈式分析引擎,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規模數據,最初由eBay公司開發並貢獻至開源社區。它能在亞秒內查詢巨大的Hive表。
本書分為21章,詳細講解Apache Kylin概念、安裝、配置、部署,讓讀者對Apache Kylin構建大數據分析平臺有一個感性認識。同時,本書從應用角度,結合Dome和實例介紹了用於多維分析的Cube算法的創建、配置與優化。最後還介紹了Kyligence公司發布KAP大數據分析平臺,對讀者有極大的參考價值。
本書適合大數據技術初學者、大數據分析人員、大數據架構師等,也適合用於高等院校和培訓學校相關專業師生教學參考。

<章節目錄>

第—部分Apache Kylin基礎部分
第1章Apache Kylin前世今生
1.1Apache Kylin的背景
1.2Apache Kylin的應用場景
1.3Apache Kylin的發展歷程
第2章Apache Kylin前奏
2.1事實表和維表
2.2星型模型和雪花型模型
2.2.1星型模型
2.2.2雪花型模型
2.2.3星型模型示例
2.3OLAP
2.3.1OLAP分類
2.3.2OLAP的基本操作
2.4數據立方體(Data Cube)
第3章Apache Kylin工作原理和體系架構
3.1 Kylin工作原理
3.2Kylin體系架構
3.3Kylin中的核心部分:Cube構建
3.4Kylin的SQL查詢
3.5Kylin的特性和生態圈
第4章搭建CDH大數據平臺
4.1系統環境和安裝包
4.1.1系統環境
4.1.2安裝包的下載
4.2準備工作:系統環境搭建
4.2.1網絡配置(CDH集群所有節點1
4.2.2打通SSH,設置ssh無密碼登錄(所有節點)
4.3正式安裝CDH:準備工作
4.4正式安裝CDH5:安裝配置
4.4.1CDH5的安裝配置
4.4.2對Hive、HBase執行簡單操作
第5章使用Kylin構建企業大數據分析平臺的4種部署方式
5.1Kylin部署的架構
5.2Kylin的四種典型部署方式
第6章單獨為Kylin部署HBase集群
第7章部署Kylin集群環境
7.1部署Kylin的先決條件
7.2部署Kylin集群環境
7.3為Kylin集群搭建負載均衡器
7.3.1搭建Nginx環境
7.3.2配置Nginx實現Kylin的負載均衡
第二部分Apache Kylin進階部分
第8章Demo案例實戰
8.1Sample Cube案例描述
8.2Sample Cube案例實戰
8.2.1準備數據
8.2.2構建Cube
第9章多維分析的Cube創建實戰
9.1Cube模型
9.2創建Cube的流程
9.2, 1步驟一:Hive中事實表,以及多張維表的處理
9.2.2步驟二:Kylin中建立項目(Project)
9.2.3步驟三:Kylin中建立數據源(Data Source)
9.2.4步驟四:Kylin中建立數據模型(Model)
9.2.5步驟五:Kylin中建立Cube
9.2.6步驟六:Build Cube
9.2.7步驟七:查詢Cube
第10章Build Cube的來龍去脈
10.1流程分析
10.2小結
第三部分Apache Kylin高級部分
第11章Cube優化
第12章備份Kylin的Metadata
12.1Kylin的元數據
12.2備份元數據
12.3恢復元數據
第13章使用Hive視圖
13.1使用Hive視圖
13.2使用視圖實戰
第14章Kylin的垃圾清理
14.1清理元數據
14.2清理存儲器數據
第15章JDBC訪問方式
第16章通過RESTful訪問Kylin
第17章Kylin版本之間升級
17.1從1.5.2升級到最新版本1.5.3
17.2從1.5.1升級到1.5.2版本
17.3從Kylin l.5.2.1升級到Kylin 1.5.3實戰
17.4補充內容
第18章大數據可視化實踐
18.1可視化工具簡述
18.2安裝Kylin ODBC驅動
18.3通過Excel訪問Kylin
18.4通過Power BI訪問Kylin
18.4.1安裝配置Power BI
18.4.2實戰操作
18.5通過Tableau訪問Kylin
18.6Kylin+Mondrian+Saiku
18.7實戰演練:通過Saiku訪問Kylin
18.7.1第一個Schema例子:myproject_pvuv_cube的演示
18.7.2第二個Schema例子:kylin_sales_cube的演示
18.7.3Saiku使用的一些問題
18.8通過Apache Zepplin訪問Kylin
18.9通過Kylin的“Insight”查詢
第19章使用Streaming Table構建準實時Cube
第20章快速數據立方算法
20.1快速數據立方算法概述
20.2快速數據立方算法優點和缺點
20.3獲取Fast Cubing算法的優勢
第四部分Apache Kylin的擴展部分
第21章大數據智能分析平臺KAP
21.1大數據智能分析平臺KAP概述
21.2KAP的安裝部署