大數據分析 : 數據挖掘必備算法示例詳解大数据分析:数据挖掘必备算法示例详解

張重生

出版商: 機械工業
出版日期: 2017-01-01
售價: $239
語言: 簡體中文
頁數: 246
裝訂: 平裝
ISBN: 7111568680
ISBN-13: 9787111555469
相關分類: 大數據 Big-data、Data Science

已絕版

買這商品的人也買了...

~~$480~~ $379

資訊視覺圖表－讓資料變好看的大數據時代資料表達術 (Cool Infographics: Effective Communication with Data Visualization and Design)
$358

計算機是怎樣跑起來的 (How Computer Works)
$354

推薦系統 (Recommender Systems: An Introduction)
$358

程式是如何跑起來的 (How Program Works)
~~$220~~ $198

大數據：語意分析整合篇
$374

Python 項目開發實戰, 2/e
$499

ASP.NET 入門經典 : 基於 Visual Studio 2015 (第9版)
$402

實用軟件架構：從系統環境到軟件部署
$234

軟件開發本質論：追求簡約、體現價值、逐步構建 (The Nature of Software Development: Keep It Simple, Make It Valuable, Build It Piece by Piece)
$474

數據實踐之美:31位大數據專家的方法、技術與思想
$293

軟件成本評估
$414

軟件需求與可視化模型(Visual Models for Software Requirements)
$474

系統分析與設計 : 敏捷疊代方法 (原書第6版)
$351

C# 物聯網應用程序開發
~~$320~~ $250

七天學會設計模式：設計模式也可以這樣學
$308

區塊鏈+ 開啟智能新時代
~~$700~~ $665

大數據分析與資料挖礦, 2/e
~~$520~~ $410

Python 機器學習與深度學習特訓班：看得懂也會做的 AI人工智慧實戰 (附120分鐘影音教學/範例程式)
$714

Python 金融大數據風控建模實戰：基於機器學習
$453

Python 廣告數據挖掘與分析實戰
$305

機器學習 — 原理、算法與 Python 實戰 (微課視頻版)
$588

裝備體系貢獻率評估 — 理論、方法與應用
$594

元宇宙通論
$516

PyTorch深度學習實戰：建構、訓練與部署神經網絡模型（原書第2版）
~~$479~~ $455

人人都能開發 RPA 機器人：UiPath 從入門到實戰

商品描述

<內容簡介>

本書詳細介紹了大數據分析，尤其是數據分類相關算法的原理及實現細節，並給出了每個算法的編程實例。全書共計21章，內容包括十大數據分類算法、十大從二元分類到多類分類的算法、九大屬性選擇算法、五大數據選擇算法，若乾集成學習方法和不均衡數據分類算法，以及大數據分析的平臺與技術。
本書可作為高等學校計算機科學與技術、數據科學與大數據技術、統計學、軟件工程、地理信息系統等專業的研究生和高年級本科生的教材，也可作為科研人員、工程師和大數據愛好者的參考書。

<章節目錄>

第1章數據分析緒論
1.1理解數據中字段的類型是數據分析的重要前提
1.2進行數據分析時數據的表示形式
1.3數據分類——數據類別的自動識別
1.4數據分類問題與回歸問題的區別與聯繫
1.5數據分析算法簡介
1.6交叉驗證
1.7一個最簡單的分類器-K近鄰分類器
1.8後續章節組織

第2章 SVM算法
2.1算法原理
2.2工具包簡介
2.3實例詳解

第3章決策樹算法
3.1信息熵值
3.2決策樹的構建目標
3.3 ID3決策樹算法
3.4 C45決策樹算法
3.5 CART決策樹算法
3.6 ID3、C45、CART算法的終止條件
3.7C45算法的參數介紹
3.8實例詳解

第4章隨機森林算法
4.1算法原理
4.2工具包介紹
4.3實例詳解

第5章梯度提升決策樹算法
5.1算法原理
5.2工具包介紹
5.3實例詳解

第6章 AdaBoost算法
6.1算法原理
6.2工具包介紹
6.3實例詳解

第7章樸素貝葉斯分類器
7.1樸素貝葉斯分類的問題定義
7.2樸素貝葉斯算法原理
7.3一種常見的樸素貝葉斯模型的錯誤計算方法
7.4樸素貝葉斯算法對連續型屬性的處理

第8章極限學習機器算法
8.1算法原理
8.2算法參數介紹
8.3實例詳解

第9章邏輯回歸算法
9.1 Logistic Regression算法流程
9.2 Logistic Regression算法原理推導

第10章稀疏表示分類算法
10.1算法原理
10.2 SRC工具包及算法參數介紹
10.3 SRC算法實例詳解

第11章不同數據分類算法性能的大規模實驗對比分析
11.1為什麼要比較不同數據分類算法的性能？
11.2不同數據分類算法性能比較的相關工作
11.3最新數據分類算法性能的大規模實驗對比分析結果
11.4結論

第12章從二分類到多分類——OVA
12.1 OVA聚合規則的核心思想
12.2 MAX聚合規則
12.3 DOO聚合規則
12.4調用示例

第13章從二分類到多分類——OVO
13.1 OVO聚合規則的核心思想
13.2 WV聚合規則
13.3 VOTE聚合規則
13.4 PC聚合規則
13.5 PE聚合規則
13.6 LVPC聚合規則
13.7調用示例

第14章從二分類到多分類——ECOC
14.1 ECOC的核心思想
14.2 ECOC編碼
14.3 ECOC譯碼
14.4 ECOC多類分類調用示例

第15章三種從二分類到多分類聚合策略的實驗對比分析
15.1 OVA策略的實驗結果
15.2 OVO策略的實驗結果
15.3 ECOC策略的實驗結果

第16章多個分類算法的集成方法研究
16.1差異性（Diversity）的原理與技術
16.2集成學習方法
16.3本章小結

第17章屬性選擇算法
17.1 fspackage和LibSVM的使用
17.2信息增益算法
17.3卡方分佈算法
17.4基於Fisher Score的屬性選擇算法
17.5基於基厄係數的屬性選擇算法
17.6基於T檢驗的屬性選擇算法

第18章高級屬性選擇算法
18.1線性前向選擇算法
18.2順序前向選擇算法
18.3基於稀疏多項式邏輯回歸的屬性選擇算法
18.4 Our——多個屬性選擇算法的集成策略
18.5屬性選擇算法的大規模實驗對比分析

第19章數據選擇算法
19.1衡量不均衡數據分類質量的常用方法
19.2 RUS算法
19.3 CNN算法
19.4 SMOTE算法
19.5 ADASYN算法
19.6 OSS算法
19.7本章小結

第20章不均衡數據分類算法及大規模實驗分析
20.1 C4.5 CS算法
20.2使用Random Forests和GBDT進行不均衡數據分類
20.3BalanceCascade不均衡數據分類算法
20.4其他不均衡數據分類算法及不均衡分類器的集成算法
20.5結合屬性選擇和數據選擇的不均衡數據分類實驗

第21章大數據分析
21.1 Spark平臺簡介
21.2基於Ambari的Spark及Spark集群的安裝與配置
21.3 Ambari集群擴展
21.4基於Spark平臺的分佈式編程示例
21.5 MLlib——Spark平臺上的機器學習庫

大數據分析 : 數據挖掘必備算法示例詳解 大数据分析:数据挖掘必备算法示例详解

張重生

買這商品的人也買了...

商品描述

類似商品

大數據分析 : 數據挖掘必備算法示例詳解大数据分析:数据挖掘必备算法示例详解