大數據十講

周烜; 陳志廣

  • 出版商: 機械工業
  • 出版日期: 2024-01-01
  • 售價: $570
  • 貴賓價: 9.5$542
  • 語言: 簡體中文
  • 頁數: 436
  • 裝訂: 平裝
  • ISBN: 7111736818
  • ISBN-13: 9787111736813
  • 相關分類: 大數據 Big-data
  • 立即出貨 (庫存 < 3)

商品描述

當下,大數據已成為互聯網、人工智慧和數位轉型等的基礎理論,
宏觀了解大數據前沿理論與技術,對於大數據方向的研究人員以及從事大數據開發的工程師來講至關重要。
本書由多位大數據領域專家學者合作完成,透過10章內容,深入淺出地闡述大數據的完整前沿知識體系,
幫助讀者以宏觀視角把握大數據的發展方向和突破口,真正從普通開發者晉升為擁有大數據思維並能解決複雜問題的技術專家。
本書既可作為大數據方向低年級研究生研究大數據技術的入門指南,
也可作為從事大數據研究的科研人員的參考書。

目錄大綱

叢書序
「十講」序
前言
第1講大資料儲存系統
1.1 大規模雲端儲存系統
1.1.1 雲端儲存系統架構
1.1.2 雲端儲存資源管理與資料佈局
1.1.3 大規模索引系統
1.2 大規模檔案系統
1.2.1 本地文件系統
1.2.2 網路文件系統
1.3 本講小結與展望
參考文獻
第2講分散式資料庫
2.1 NoSQL與NewSQL
2.1.1 NoSQL發展歷史
2.1.2 鍵值儲存
2.1.3 文檔資料庫
2.1.4圖資料庫
2.1.5 NewSQL代表
2.2 分散式資料庫架構
2.2.1 共享儲存型
2.2.2 無共享型
2.2.3 運算、記憶體與儲存分離型
2.2.4 架構比較
2.3 資料分片與複製
2.3.1 資料分片
2.3.2 資料複製
2.3.3 CAP定理
2.3.4 分散式一致性協定
2.4 分散式資料處理
2.4.1 分散式事務處理
2.4.2 分散式查詢處理
2.5 本講小結與展望
參考文獻
第3講大資料處理系統-批次
3.1 Hadoop MapReduce
3.1.1 Hadoop MapReduce概述
3.1.2 Hadoop MapReduce架構與核心元件
3.1.3 Hadoop MapReduce執行過程
3.1.4 MapReduce程式設計案例
3.1.5 Hadoop生態
3.2 Apache Spark 3.2.1 Spark
3.2.1 Spark概述
3.2.2 Spark架構
3.2.3 Spark程式設計實例
3.2.4 Spark工具集
3.3 本講小結與展望
參考文獻
第4講流計算系統
4.1 流計算系統概述
4.1.1 流資料與流計算
4.1.2 流計算系統的演進
4.1.3 流程運算系統的研究挑戰
4.2 資料管理視角的流程運算系統
4.2.1 程式介面
4.2.2 執行計畫
4.2.3 資源調度
4.2.4 故障容錯
4.3 本講小結與展望
參考文獻
第5講大圖資料處理系統
5.1 大圖資料處理系統概述
5.1.1 大圖資料特性及查詢
5.1.2 大圖資料處理特性及挑戰
5.1.3 經典大圖資料處理系統
5.2 電腦制
5.2.1 以頂點為中心的電腦制
5.2.2 以邊為中心的電腦制
5.2.3 以子圖為中心的電腦制
5.3 通訊機制
5.3.1 共享記憶體
5.3.2 訊息傳遞
5.4 圖劃分機制
5.4.1 邊切分
5.4. 2 點切分
5.4.3 混合切分
5.5 任務調度機制
5.5.1 同步調度
5.5.2 非同步調度
5.5.3 混合調度
5.6 新硬體加速機制
5.6.1 基於RDMA的通訊最佳化
5.6.2 基於GPU的運算最佳化
5.7 本講小結與展望
參考文獻
第6講大數據分析-演算法設計
6.1 大數據的統計特徵估算演算法
6.1.1 取樣估算演算法
6.1.2 Sketch估算演算法
6.1.3 相關應用
6.2 大數據的成員查找演算法
6.2.1 機率型成員尋找演算法
6.2.2 人工智慧賦能的成員查找演算法
6.2.3 相關應用
6.3 大數據的近鄰查找演算法
6.3.1 精確近鄰查找演算法
6.3.2 近似近鄰查找演算法
6.3.3 相關應用與潛在研究方向
6.4 本講小結與展望
參考文獻
第7講大數據分析-機器學習
7.1 概述
7.1.1 機器學習、深度學習與人工智慧
7.1.2大數據與機器學習的關係
7.1.3 大數據上機器學習存在的問題與挑戰
7.2 BigDL:分散式大數據AI平台
7.2.1 設計目標與架構
7.2.2 BigDL-Nano:對使用者透明的效能加速
7.2 .3 BigDL-Orca:從筆記型電腦到分散式大數據集群的無縫擴展
7.3 大數據AI在生產實踐中的真實案例
7.3.1 案例1:基於時序預測的通信網絡質量KPI監測
7.3.2 案例2 :基於Transformer架構的分散式AI推薦系統
7.4 本講小結與展望
參考文獻
第8講圖資料探勘
8.1 圖的基本定義及性質
8.1.1 柯尼斯堡七橋問題
8.1.2 圖的基本定義
8.1.3圖的基本性質
8.2 圖節點鄰近度
8.2.1 圖節點鄰近度的量測
8.2.2 圖節點鄰近度的計算
8.3 圖嵌入
8.3.1 基於矩陣分解的方法
8.3.2 基於隨機遊走的方法
8.4 圖神經網路
8.4.1 圖神經網路的起源與演變
8.4.2 可擴展圖神經網路
8.4.3 複雜圖神經網路
8.5 本講小結與展望
參考文獻
第9講大數據視覺化
9.1 視覺化發展史與理論模型
9.1.1早期的視覺化
9.1.2 基本流程
9.2 概念、分類及主要方法
9.2.1 資料類型及視覺映射
9.2.2 高維度與表格資料​​視覺化
9.2.3 網路(圖)資料視覺化
9.2.4 層次結構資料視覺化
9.2. 5 時空資料視覺化
9.2.6 文字資料視覺化
9.3 視覺分析
9.3.1 基本理論
9.3.2 視覺化與視覺分析案例
9.4 大規模資料管理
9.4.1 資料立方體
9.4.2 其他資料管理方法
9.5 常用視覺化工具與軟體
9.5.1 高維度資料視覺化工具
9.5.2 文字視覺化工具
9.5.3 網路視覺化工具
9.5.4 視覺