買這商品的人也買了...
-
Hadoop 技術手冊, 3/e (Hadoop: The Definitive Guide, 3/e)$880$695 -
信號完整性揭秘 — 於博士 SI 設計手記$534$507 -
$174Spark 快速數據處理 (Fast Data Processing with Spark) -
$354Spark 大數據處理(技術應用與性能優化) -
提升 iOS 8 App 程式設計進階實力的 30 項關鍵技巧 + 養成 iOS 8 App 程式設計實力的 25 堂課(套書)$1,170$913 -
Android App 程式設計教本之無痛起步 -- 使用 Android Studio 開發環境$550$468 -
敏捷與 Scrum 軟體開發速成 (The Elements of Scrum)(暢銷回饋版)$280$218 -
精通 Python|運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)$780$616 -
完整學會 Git, GitHub, Git Server 的24堂課$360$284 -
$294Spark 技術內幕 (深入解析Spark內核架構設計與實現原理) -
Hadoop 的下一步:深度使用大數據查詢引擎 Impala$580$493 -
iOS 9 App 程式設計實力超進化實戰攻略:知名iOS教學部落格AppCoda作家親授實作關鍵技巧讓你不NG (Beginning iOS 9 Programming with Swift)$690$538 -
大數據分析處理:Spark技術、應用與性能優質化$750$638 -
SOA 架構的唯一途徑 – Apache CXF完美建立企業解決方案 (舊版: 用 Apache CXF 建立企業級的 SOA 架構應用)$580$493 -
$301Spark大資料分析實戰 -
Raspberry Pi 3 Model B(UK製) (晶片升級版:BCM2837B0)$1,680$1,596 -
培養與鍛鍊程式設計的邏輯腦:程式設計大賽的解題策略基礎入門, 2/e + 世界級程式設計大賽的知識、心得與解題分享, 2/e (套書)$800$624 -
職業駭客的告白 : 軟體反組譯、木馬病毒與入侵翻牆竊密$620$484 -
$202深度學習:方法及應用 -
JavaScript 資料結構及演算法實作 (Learning JavaScript Data Structures and Algorithms)$320$250 -
快速查, 馬上用! CSS3+jQuery 手機網站 UI 範例實作$450$383 -
$450Spark核心源碼分析與開發實戰 -
$354零成本實現Web自動化測試:基於Selenium WebDriver和Cucumber -
$714Scala 編程實戰 -
$354Spark內核機制解析及性能調優
商品描述
<內容介紹>
《Spark(原理機制及應用)》以Spark 1.4為基礎,詳細介紹了spark技術概況、內部機制和應用情況。作者劉馳結合國內外眾多資料和項目經驗,力求深入淺出地講解spark技術的生態應用和發展狀況,選取了Spark summ「中的典型案例進行解析,為讀者全國展現spark技術在業界的應用情況。
本書適合spark技術初學者、spark技術愛好者、spark運維工程師和開源軟件愛好者,也可以作為相關培訓學校和大專院校相關專業的教學用書。
<章節目錄>
前言
第一篇 概念篇
第1章 Spark概述
1.1 Spark初見
1.1.1 Spark的發展史及近況
1.1.2 Spark的特點
1.1.3 Spark的作用
1.1.4 Spark的體系結構
1.1.5 Spark的發展趨勢
1.2 Spark框架
1.2.1 批處理框架
1.2.2 流處理框架
1.3 Spark的生態系統
1.4 Spark的數據存儲
1.5 本章小結
第2章 Spark環境配置
2.1 Spark運行環境配置
2.1.1 先決條件
2.1.2 下載與運?
2.1.3 使用交互?
2.1.4 搭建Spark Standalone集群
2.2 Spark開發環境配置
2.2.1 Spark獨立應用程序
2.2.2 構建IDE開發環境
2.3 Spark編譯環境配置
2.3.1 使用Maven編譯項目源碼
2.3.2 使用IDEA搭建源碼編譯與
閱讀環境
2.4 本章小結
第二篇 開發篇
第3章 Spark核心開發
3.1 Spark編程模型概述
3.2 Spark
3.2.1 SparkContext的作用
3.2.2 SparkContext的創建
3.2.3 使用
3.2.4 應用實踐
3.3 RDD簡介
3.3.1 RDD創建
3.3.2 RDD轉換操作
3.3.3 RDD動作操作
3.3.4 RDD惰性計算
3.3.5 RDD持久化
3.3.6 RDD檢查點
3.4 共享變量
3.4.1 廣播變量
3.4.2 累加器
3.5 Spark核心開發實踐
3.5.1 單值型Trasnformation算子
3.5.2 鍵值對型Transformation算子
3.5.3 Action算子
3.6 本章小結
第4章 Spark四大應用技術框架
4.1 Sp
4.1.1 Spark SQL入門
4.1.2 數據源
4.1.3 性能調優
4.1.4 分佈式SQL引擎
4.1.5 Shark遷移至Spark SQL指南
4.1.6 Hive的兼容性
4.1.7 Spark SQL數據類型
4.2 Spark St
4.2.1 Spark Streaming簡介
4.2.2 入門實例
4.2.3 基本概念
4.3 Spark
4.3.1 Spark GraphX簡介
4.3.2 屬性圖
4.3.3 圖操作
4.3.4 Preg
4.3.5 圖構造器
4.3.6 頂點與邊相關
4.3.7 最優化表示
4.3.8 圖演算法
4.3.9 E
4.4 Spark
4.4.1 Spark MLlib簡介
4.4.2 數據類型
4.4.3 基本統計分析
4.4.4 分類與回歸
4.4.5 協同過濾
4.4.6 聚類
4.4.7 降維
4.4.8 特徵提取與轉換
4.4.9 頻繁模式挖掘
4.4.10 最優化演算法
4.4.11 導出PMML模式
4.5
4.5.1 SparkR Dat
4.5.2 DataFrame的相關操作
4.5.3 從SparkR運行SQL查詢
第5章 Spark系統配置與調優
……
第三篇 機制篇
第四篇 應用篇
