數據虛擬化 多源異構數據集成之道
劉媛妮 趙國鋒 李昕 李楊 程新洲 李明欣
- 出版商: 人民郵電
- 出版日期: 2019-12-01
- 定價: $888
- 售價: 8.5 折 $755
- 語言: 簡體中文
- ISBN: 7115497354
- ISBN-13: 9787115497352
-
相關分類:
虛擬化技術 Virtualization
已絕版
買這商品的人也買了...
-
$505圖解Spark:核心技術與案例實戰
-
$449收穫,不止 SQL 優化 — 抓住 SQL 的本質
-
$450$356 -
$454Hadoop 構建數據倉庫實踐 (Practice of Hadoop data warehouse)
-
$403AWS Lambda 實戰 : 開發事件驅動的無服務器應用程序 (AWS Lambda in Action: Event-Driven Serverless Applications)
-
$254亞馬遜 AWS 雲基礎與實戰
-
$474$450 -
$414$393 -
$680$578 -
$419$398 -
$505Docker數據中心及其內核技術
-
$602知識圖譜:概念與技術
-
$454Python 3反爬蟲原理與繞過實戰
-
$680$537 -
$653AWS 高級網絡官方學習指南 (專項領域) (AWS Certified Advanced Networking Official Study Guide: Specialty Exam)
-
$414$393 -
$414$393 -
$254文本數據挖掘與 Python 應用
-
$449財務報表分析與商業決策
-
$509Jupyter 金融應用 從入門到實踐
-
$600$468 -
$880$748 -
$505數據架構之道:數據模型設計與管控
-
$505運維數據治理:構築智能運維的基石
-
$539$512
相關主題
商品描述
本書介紹了在當前大數據、人工智能的背景下,使用數據虛擬化技術實現多源異構數據集成的方法。本書共 9 章,首先,分析了當前多源異構數據分析面臨的問題以及傳統方法的局限。其次,介紹了數據虛擬化的相關概念、數據虛擬化體系架構、關鍵技術,以及利用數據虛擬化服務器構建虛擬化層的方法及原則。最後,通過案例介紹瞭如何使用數據虛擬化實現海量多源異構數據的管理,並對數據虛擬化進行了未來展望。本書適合高校、科研院所的相關人士閱讀。
目錄大綱
第1章概述1
1.1背景1
1.1.1大數據時代下的數據增長1
1.1.2上層應用對數據服務的需求4
1.2 DaaS 8
1.2.1 DaaS的歷史8
1.2.2 DaaS的定義10
1.2.3服務11
1.2.4服務的分類13
1.2.5數據服務14
1.2.6數據服務及其架構16
1.2.7數據服務的關鍵技術18
1.2.8 DaaS的特點19
1.3 DaaS面臨的問題19
參考文獻21
第2章多源異構數據處理關鍵技術22
2.1多源異構數據的產生與收集22
2.1.1多源異構數據的產生22
2.1.2多源異構數據的收集24
2.2多源異構數據的存儲46
2.2.1多源異構數據的類型46
2.2.2多源異構數據存儲的關鍵技術47
2.3數據倉庫72
2.3.1數據倉庫的定義及特點73
2.3.2數據倉庫的體系結構74
2.4多源異構數據的組織管理77
2.5多源異構數據的分析87
2.5.1分類算法88
2.5. 2回歸算法94
2.5.3聚類算法98
2.5.4關聯規則算法99
2.5.5神經網絡算法102
2.6數據分析平台113
2.6.1 Hadoop 114
2.6.2 Spark 116
2.6.3 Storm 117
2.6.4機器學習框架120
參考文獻122
第3章數據虛擬化124
3.1背景124
3.2數據虛擬化概述126
3.2.1數據虛擬化的定義128
3.2.2數據虛擬化及其相關概念129
3.3數據虛擬化的技術優點133
3.4數據虛擬化的不同實現方式137
3.5數據虛擬化的應用138
參考文獻144
第4章數據虛擬化系統架構146
4.1數據虛擬化系統架構概述146
4.2數據虛擬化系統詳細模型149
4.2.1應用層150
4.2.2數據虛擬化層150
4.2.3源數據層151
4.3數據虛擬化研究的問題152
參考文獻156
第5章數據虛擬化平面159
5.1數據映射層159
5.1.1源表格、虛擬表格、映射、封裝的定義159
5.1.2虛擬表格和映射的例子165
5.2元數據組織層174
5.2.1元數據的基本概念174
5.2.2元數據的組織方法178
5.3數據服務層188
5.3.1虛擬表格的發布188
5.3.2虛擬表格和數據建模193
5.3.3數據安全:認證和授權215
5.4查詢響應層217
5.4.1緩存技術217
5.4.2查詢優化224
參考文獻235
第6章數據虛擬化的管理平面237
6.1源表格、封裝表格、虛擬表格的同步237
6.2元數據組織層的管理238
6.3虛擬表格或數據服務組合、更新過程的維護240
6.4查詢響應層的監控、處理和管理242
參考文獻245
第7章數據虛擬化系統的設計247
7.1對現有系統部署數據虛擬化247
7.1.1部署數據虛擬化的步驟247
7.1.2醫療數據倉庫引入數據虛擬化249
7.2設計和開發新的數據虛擬化系統251
參考文獻265
第8章數據虛擬化的應用案例266
8.1背景介紹266
8.1.1 FITS 267
8.1.2流式數據處理平台268
8.1.3圖形數據庫269
8.1.4圖劃分技術270
8.2天文元數據實時歸檔系統設計272
8.2 .1元數據採集模塊273
8.2.2元數據處理模塊275
8.2.3元數據存儲模塊284
8.3系統功能測試286
8.3.1實驗環境286
8.3.2功能測試288
參考文獻290
第9章數據虛擬化的未來292
9.1數據虛擬化的未來--Rick F.van der Lans的理解293
9.1.1新的以及增強的查詢優化技術293
9.1.2探索新的硬件技術294
9.1.3不斷擴展的設計模型295
9.1 .4數據質量的特性297
9.1.5對數據訪問下推模型的支持299
9.1.6數據虛擬化、ETL以及復制之間的協作300
9.2數據虛擬化的未來--全局數據網絡301
9.2.1被授權的消費者從無處不在的數據訪問獲益301
9.2.2 IT的後台管理系統變為雲302
9.2.3數據虛擬化的未來是一個全局數據網絡302
9.2.4小結303
9.3數據虛擬化的未來--多種數據處理方法的結合303
9.4數據虛擬化的未來--在虛擬化的世界中佔據一席之地305
9.4.1使用數據虛擬化最大化數據的回報306
9.4.2透過表像看問題307
參考文獻308
中英文對照表309
名詞索引313