Hadoop大數據分析與挖掘實戰 Hadoop大数据分析与挖掘实战

張良均, 樊哲, 李成華, 劉麗君, 等

  • 出版商: 機械工業
  • 出版日期: 2016-01-01
  • 定價: $414
  • 售價: 8.5$352
  • 語言: 簡體中文
  • 頁數: 290
  • 裝訂: 平裝
  • ISBN: 7111522656
  • ISBN-13: 9787111522652
  • 相關分類: Hadoop大數據 Big-dataData Science
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

商品描述

<內容簡介>
 
本書充滿了從多年投資與信貸業務中獲得的深刻的洞察,討論了廣泛的議題,包括:現金CDO違約相關性貸款與貸款擔保證券CDO權益級結構化產品CDO和擔保品概覽CDO套利新興市場和市值型CDO及合成型CDO以及更多相關的議題CDO為那些能夠理解其複雜性的人們提供了激動人心的機會。借助本書第2版的指導,讀者能夠理解並且利用這一變化的市場及其相關產品。

<章節目錄>

前言
基礎篇
第1章數據挖掘基礎2
1.1某知名連鎖餐飲企業的困惑2
1.2從餐飲服務到數據挖掘3
1.3數據挖掘的基本任務4
1.4數據挖掘建模過程4
1.4.1定義挖掘目標4
1.4. 2數據取樣5
1.4.3數據探索6
1.4.4數據預處理12
1.4.5挖掘建模14
1.4.6模型評價14
1.5餐飲服務中的大數據應用15
1.6小結15
第2章Hadoop基礎16
2.1概述16
2.1.1 Hadoop簡介16
2.1.2 Hadoop生態系統17
2.2安裝與配置19
2.3 Hadoop原理26
2.3.1 Hadoop HDFS原理26
2.3.2 Hadoop MapReduce原理27
2.3.3 Hadoop YARN原理28
2.4動手實踐30
2.5小結33
第3章Hadoop生態系統:Hive34
3.1概述34
3.1.1 Hive簡介34
3.1 .2 Hive安裝與配置35
3.2 Hive原理38
3.2.1 Hive架構38
3.2.2 Hive的數據模型40
3.3動手實踐41
3.4小結45
第4章Hadoop生態系統:HBase46
4.1概述46
4.1.1 HBase簡介46
4.1 .2 HBase安裝與配置47
4.2 HBase原理50
4.2.1 HBase架構50
4.2.2 HBase與RDBMS51
4.2.3 HBase訪問接口52
4.2.4 HBase數據模型53
4.3動手實踐54
4.4小結61
第5章大數據挖掘建模平臺62
5.1常用的大數據平臺62
5.2 TipDM-HB大數據挖掘建模平臺63
5.2.1 TipDM-HB大數據挖掘建模平臺的功能63
5.2.2 TipDM-HB大數據挖掘建模平臺操作流程及實例65
5.2.3 TipDM-HB大數據挖掘建模平臺的特點67
5.3小結68
第6章挖掘建模69
6.1分類與預測69
6.1.1實現過程69
6.1.2常用的分類與預測算法70
6.1.3決策樹71
6.1.4 Mahout中Random Forests算法的實現原理75
6.1.5動手實踐79
6.2聚類分析83
6.2.1常用聚類分析算法83
6.2.2 K-Means聚類算法84
6.2. 3 Mahout中K-Means算法的實現原理88
6.2.4動手實踐90
6.3關聯規則93
6.3.1常用的關聯規則算法93
6.3.2 FP-Growth關聯規則算法94
6.3.3 Mahout中Parallel Frequent Pattern Mining算法的實現原理98
6.3.4動手實踐100
6.4協同過濾102
6.4.1常用的協同過濾算法102
6.4.2基於項目的協同過濾算法簡介102
6.4.3 Mahout中Itembased Collaborative Filtering算法的實現原理103
6.4.4動手實踐106
6.5小結109
實戰篇
第7章法律諮詢數據分析與服務推薦112
7.1背景與挖掘目標112
7.2分析方法與過程114
7.2.1數據抽取120
7.2.2數據探索分析120
7.2.3數據預處理125
7.2.4模型構建130
7.3上機實驗139
7.4拓展思考140
7.5小結145
第8章電商產品評論數據情感分析146
8.1背景與挖掘目標146
8.2分析方法與過程146
8.2.1評論數據採集147
8.2 .2評論預處理150
8.2.3文本評論分詞155
8.2.4構建模型155
8.3上機實驗167
8.4拓展思考168
8.5小結169
第9章航空公司客戶價值分析170
9.1背景與挖掘目標170
9.2分析方法與過程171
9.2.1數據抽取174
9.2.2數據探索分析174
9.2.3數據預處理175
9.2.4模型構建177
9.3上機實驗182
9.4拓展思考183
9.5小結183
第10章基站定位數據商圈分析184
10.1背景與挖掘目標184
10.2分析方法與過程186
10.2.1數據抽取186
10.2.2數據探索分析187
10.2.3數據預處理188
10.2.4構建模型191
10.3上機實驗194
10.4拓展思考195
10.5小結195
第11章因特網電影智能推薦196
11.1背景與挖掘目標196
11.2分析方法與過程197
11.2.1數據抽取199
11.2.2構建模型199
11.3上機實驗201
11.4拓展思考202
11.5小結203
第12章家電故障備件儲備預測分析204
12.1背景與挖掘目標204
12.2分析方法與過程206
12.2.1數據探索分析207
12.2.2數據預處理209
12.2.3構建模型212
12.3上機實驗216
12.4拓展思考217
12.5小結217
第13章市供水混凝投藥量控制分析218
13.1背景與挖掘目標218
13.2分析方法與過程220
13.2.1數據抽取221
13.2.2數據探索分析221
13.2.3數據預處理223
13.2.4構建模型227
13.3上機實驗237
13.4拓展思考238
13.5小結239
第14章基於圖像處理的車輛壓雙黃線檢測240
14.1背景與挖掘目標240
14.2分析方法與過程241
14.2.1數據抽取242
14.2.2數據探索分析242
14.2 .3數據預處理242
14.2.4構建模型249
14.3上機實驗250
14.4拓展思考250
14.5小結251
高級篇
第15章基於Mahout的大數據挖掘開發254
15.1概述254
15.2環境配置255
15.3基於Mahout算法接口的二次開發258
15.3.1 Mahout算法實例258
15.3.2 Mahout算法接口的二次開發示例259
15.4小結271
第16章基於TipDM-HB的數據挖掘二次開發272
16.1概述272
16.1.1 TipDM-HB大數據挖掘建模平臺服務接口272
16.1.2 Apache CXF簡介276
16.2 TipDM-HB大數據挖掘建模平臺服務開發實例277
16.2.1環境配置277
16.2.2開發實例280
16.3小結288
參考資料289