Hadoop大數據分析與挖掘實戰 Hadoop大数据分析与挖掘实战
張良均, 樊哲, 李成華, 劉麗君, 等
- 出版商: 機械工業
 - 出版日期: 2016-01-01
 - 售價: $414
 - 語言: 簡體中文
 - 頁數: 290
 - 裝訂: 平裝
 - ISBN: 7111522656
 - ISBN-13: 9787111522652
 - 
    相關分類:
    
      Hadoop、Data-mining、大數據 Big-data
 
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
- 
                
                  
                  
                大話設計模式$620$490 - 
                
                  
                  
                精通 Linux 核心開發-設計與實作 Linux 核心的權威指南, 3/e (Linux Kernel Development, 3/e)$680$537 - 
                
                  
                  
                JavaScript 大全, 6/e (JavaScript: The Definitive Guide: Activate Your Web Pages, 6/e)$1,200$948 - 
                
                  
                  
                Arduino UNO R3 開發板(副廠相容版)附傳輸線$400$380 - 
                
                  
                  
                Arduino RFID 套件 (附範例程式下載連結)$1,850$1,758 - 
                
                  
                  
                Responsive Web Design 自動調適型網頁程式設計-讓網頁在電腦 / 平板 / 手機完美展現$360$306 - 
                
                  
                  
                ASP.NET MVC 5 網站開發美學$780$616 - 
                
                  
                  
                JAVA SE 8 基礎必修課$530$419 - 
                
                  
                  
                $354Spark 大數據處理(技術應用與性能優化) - 
                
                  
                  
                $354實用資料分析 (Practical Data Analysis) - 
                
                  
                  
                $414資料採擷技術與工程實踐 - 
                
                  
                  
                $352MATLAB 數據分析與挖掘實戰 - 
                
                  
                  
                Android App 程式設計教本之無痛起步 -- 使用 Android Studio 開發環境$550$468 - 
                
                  
                  
                大話重構$390$304 - 
                
                  
                  
                $352R語言數據分析與挖掘實戰 - 
                
                  
                  
                Raspberry Pi 最佳入門與實戰應用, 2/e (適用 Raspberry Pi 2/Raspberry Pi 第一代)$450$356 - 
                
                  
                  
                7天學會 Git 版本控制 (Git Essentials)$280$218 - 
                
                  
                  
                7天學會大數據資料處理—NoSQL:MongoDB入門與活用$320$250 - 
                
                  
                  
                $301Spark大資料分析實戰 - 
                
                  
                  
                $311Spark核心技術與高級應用 - 
                
                  
                  
                $414Python 資料分析與挖掘實戰 - 
                
                  
                  
                $354資料採擷核心技術揭秘 - 
                
                  
                  
                你所不知道的 JS|導讀,型別與文法 (You Don't Know JS: Up & Going)$520$411 - 
                
                  
                  
                Python 程式設計實務-從初學到活用 Python 開發技巧的16堂課$560$437 - 
                
                  
                  
                Entity Framework 實務精要$650$553 
商品描述
<內容簡介>
 
本書充滿了從多年投資與信貸業務中獲得的深刻的洞察,討論了廣泛的議題,包括:現金CDO違約相關性貸款與貸款擔保證券CDO權益級結構化產品CDO和擔保品概覽CDO套利新興市場和市值型CDO及合成型CDO以及更多相關的議題CDO為那些能夠理解其複雜性的人們提供了激動人心的機會。借助本書第2版的指導,讀者能夠理解並且利用這一變化的市場及其相關產品。 
<章節目錄>
前言
基礎篇
第1章數據挖掘基礎2 
1.1某知名連鎖餐飲企業的困惑2 
1.2從餐飲服務到數據挖掘3 
1.3數據挖掘的基本任務4 
1.4數據挖掘建模過程4 
1.4.1定義挖掘目標4 
1.4. 2數據取樣5 
1.4.3數據探索6 
1.4.4數據預處理12 
1.4.5挖掘建模14 
1.4.6模型評價14 
1.5餐飲服務中的大數據應用15 
1.6小結15 
第2章Hadoop基礎16 
2.1概述16 
2.1.1 Hadoop簡介16 
2.1.2 Hadoop生態系統17 
2.2安裝與配置19
2.3 Hadoop原理26 
2.3.1 Hadoop HDFS原理26 
2.3.2 Hadoop MapReduce原理27 
2.3.3 Hadoop YARN原理28 
2.4動手實踐30 
2.5小結33 
第3章Hadoop生態系統:Hive34 
3.1概述34 
3.1.1 Hive簡介34 
3.1 .2 Hive安裝與配置35 
3.2 Hive原理38 
3.2.1 Hive架構38 
3.2.2 Hive的數據模型40 
3.3動手實踐41 
3.4小結45 
第4章Hadoop生態系統:HBase46 
4.1概述46 
4.1.1 HBase簡介46 
4.1 .2 HBase安裝與配置47 
4.2 HBase原理50 
4.2.1 HBase架構50 
4.2.2 HBase與RDBMS51 
4.2.3 HBase訪問接口52 
4.2.4 HBase數據模型53 
4.3動手實踐54 
4.4小結61 
第5章大數據挖掘建模平臺62 
5.1常用的大數據平臺62 
5.2 TipDM-HB大數據挖掘建模平臺63 
5.2.1 TipDM-HB大數據挖掘建模平臺的功能63 
5.2.2 TipDM-HB大數據挖掘建模平臺操作流程及實例65 
5.2.3 TipDM-HB大數據挖掘建模平臺的特點67 
5.3小結68 
第6章挖掘建模69 
6.1分類與預測69 
6.1.1實現過程69 
6.1.2常用的分類與預測算法70 
6.1.3決策樹71 
6.1.4 Mahout中Random Forests算法的實現原理75 
6.1.5動手實踐79 
6.2聚類分析83 
6.2.1常用聚類分析算法83 
6.2.2 K-Means聚類算法84 
6.2. 3 Mahout中K-Means算法的實現原理88 
6.2.4動手實踐90 
6.3關聯規則93 
6.3.1常用的關聯規則算法93 
6.3.2 FP-Growth關聯規則算法94 
6.3.3 Mahout中Parallel Frequent Pattern Mining算法的實現原理98 
6.3.4動手實踐100 
6.4協同過濾102 
6.4.1常用的協同過濾算法102 
6.4.2基於項目的協同過濾算法簡介102 
6.4.3 Mahout中Itembased Collaborative Filtering算法的實現原理103 
6.4.4動手實踐106 
6.5小結109 
實戰篇
第7章法律諮詢數據分析與服務推薦112 
7.1背景與挖掘目標112 
7.2分析方法與過程114 
7.2.1數據抽取120 
7.2.2數據探索分析120 
7.2.3數據預處理125 
7.2.4模型構建130 
7.3上機實驗139 
7.4拓展思考140 
7.5小結145 
第8章電商產品評論數據情感分析146 
8.1背景與挖掘目標146 
8.2分析方法與過程146 
8.2.1評論數據採集147 
8.2 .2評論預處理150 
8.2.3文本評論分詞155 
8.2.4構建模型155 
8.3上機實驗167 
8.4拓展思考168 
8.5小結169 
第9章航空公司客戶價值分析170 
9.1背景與挖掘目標170 
9.2分析方法與過程171 
9.2.1數據抽取174 
9.2.2數據探索分析174 
9.2.3數據預處理175 
9.2.4模型構建177 
9.3上機實驗182 
9.4拓展思考183 
9.5小結183 
第10章基站定位數據商圈分析184 
10.1背景與挖掘目標184 
10.2分析方法與過程186 
10.2.1數據抽取186 
10.2.2數據探索分析187 
10.2.3數據預處理188 
10.2.4構建模型191 
10.3上機實驗194 
10.4拓展思考195 
10.5小結195 
第11章因特網電影智能推薦196 
11.1背景與挖掘目標196 
11.2分析方法與過程197 
11.2.1數據抽取199 
11.2.2構建模型199 
11.3上機實驗201 
11.4拓展思考202 
11.5小結203 
第12章家電故障備件儲備預測分析204 
12.1背景與挖掘目標204 
12.2分析方法與過程206 
12.2.1數據探索分析207 
12.2.2數據預處理209 
12.2.3構建模型212 
12.3上機實驗216 
12.4拓展思考217 
12.5小結217 
第13章市供水混凝投藥量控制分析218 
13.1背景與挖掘目標218 
13.2分析方法與過程220 
13.2.1數據抽取221 
13.2.2數據探索分析221 
13.2.3數據預處理223 
13.2.4構建模型227 
13.3上機實驗237 
13.4拓展思考238 
13.5小結239 
第14章基於圖像處理的車輛壓雙黃線檢測240 
14.1背景與挖掘目標240 
14.2分析方法與過程241 
14.2.1數據抽取242 
14.2.2數據探索分析242 
14.2 .3數據預處理242 
14.2.4構建模型249 
14.3上機實驗250 
14.4拓展思考250 
14.5小結251 
高級篇
第15章基於Mahout的大數據挖掘開發254 
15.1概述254 
15.2環境配置255 
15.3基於Mahout算法接口的二次開發258 
15.3.1 Mahout算法實例258 
15.3.2 Mahout算法接口的二次開發示例259 
15.4小結271 
第16章基於TipDM-HB的數據挖掘二次開發272 
16.1概述272 
16.1.1 TipDM-HB大數據挖掘建模平臺服務接口272 
16.1.2 Apache CXF簡介276 
16.2 TipDM-HB大數據挖掘建模平臺服務開發實例277 
16.2.1環境配置277 
16.2.2開發實例280 
16.3小結288 
參考資料289 
