R語言數據挖掘:實用項目解析 (R Data Mining Blueprints) R语言数据挖掘:实用项目解析

普拉迪帕塔·米什拉 (Pradeepta Mishra)

  • 出版商: 機械工業
  • 出版日期: 2017-05-01
  • 定價: $294
  • 售價: 8.5$250
  • 語言: 簡體中文
  • 頁數: 187
  • 裝訂: 平裝
  • ISBN: 7111565207
  • ISBN-13: 9787111565208
  • 相關分類: R 語言Data-mining
  • 此書翻譯自: R Data Mining Blueprints
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

商品描述

將闡述數據挖掘的一些主題,如數學表述、在軟件中的實現,以及如何據此來解決商業問題。本書旨在讓讀者可以從數據管理技術、探索性數據分析、數據可視化等內容著手學習,循序漸進,直至建立高級預測模型。本書也從數據科學、分析學、統計建模以及可視化等角度對數據挖掘這一概念進行了綜

作者簡介

作者:(印度)普拉迪帕塔·米甚拉(Pradeepta Mishra)譯者:黃芸

普拉迪帕塔·米甚拉(Pradeepta Mishra),數據科學家、預測模型專家、深度學習和機器學習實踐者、計量經濟學家,目前在印度班加羅爾的MaFoiAnalytics主導數據科學和機器學習實踐。他持有零售行業中增強貨架圖設計的專利,並且在艾哈邁德巴德印度管理學院就讀期間發表了相關的研究論文。他現在還是很多頂尖商科院校的客座教師,經常開展數據科學和機器學習的講座。


黃芸,畢業於山東大學數學專業,先後從事銀行業與IT諮詢業的數據相關工作,曾參與信用卡評分決策系統、內部信用評級的模型監控與管理,以及建立預測模型提高呼叫中心運營效率等項目。

目錄大綱

譯者序
前言
第1章使用R內置數據進行數據處理1
1.1什麼是數據挖掘2
1.2R語言引論4
1.2.1快速入門4
1.2.2數據類型、向量、數組與矩陣4
1.2.3列表管理、因子與序列7
1.2.4數據的導入與導出8
1.3數據類型轉換10
1.4排序與合併數據框11
1.5索引或切分數據框15
1.6日期與時間格式化16
1.7創建新函數17
1.7.1用戶自定義函數17
1.7.2內置函數18
1.8循環原理——for循環18
1.9循環原理——repeat循環19
1.10循環原理——while循環19
1.11apply原理19
1.12字符串操作21
1.13缺失值(NA)的處理22
小結23
第2章汽車數據的探索性分析24
2.1一元分析24
2.2二元分析30
2.3多元分析31
2.4解讀分佈和變換32
2.4.1正態分佈32
2.4.2二項分佈34
2.4.3泊松分佈34
2.5解讀分佈34
2.6變量分段37
2.7列聯表、二元統計及數據正態性檢驗37
2.8假設檢驗41
2.8.1總體均值檢驗42
2.8.2雙樣本方差檢驗46
2.9無參數方法48
2.9.1Wilcoxon符號秩檢驗 49
2.9.2Mann—Whitney—Wilcoxon檢驗49
2.9.3Kruskal—Wallis檢驗49
小結50
第3章可視化diamond數據集51
3.1使用ggplot2可視化數據54
3.1.1條狀圖64
3.1.2盒狀圖65
3.1.3氣泡圖65
3.1.4甜甜圈圖66
3.1.5地理製圖67
3.1.6直方圖68
3.1.7折線圖68
3.1.8餅圖69
3.1.9散點圖70
3.1.10堆疊柱形圖75
3.1.11莖葉圖75
3.1.12詞云76
3.1.13鋸齒圖76
3.2使用plotly78
3.2.1氣泡圖78
3.2.2用plotly畫條狀圖79
3.2.3用plotly畫散點圖79
3.2. 4用plotly畫盒狀圖80
3.2.5用plotly畫極坐標圖82
3.2.6用plotly畫極坐標散點圖82
3.2.7極坐標分區圖83
3.3創建地理製圖84
小結84
第4章用汽車數據做回歸85
4.1回歸引論85
4.1.1建立回歸問題86
4.1.2案例學習87
4.2線性回歸87
4.3通過逐步回歸法進行變量選取98
4.4Logistic回歸99
4.5三次回歸105
4.6懲罰回歸106
小結109
第5章基於產品數據的購物籃分析110
5.1購物籃分析引論110
5.1.1什麼是購物籃分析111
5.1.2哪裡會用到購物籃分析11 2
5.1.3數據要求112
5.1.4前提假設/要求114
5.1.5建模方法114
5.1.6局限性114
5.2實際項目115
5.2.1先驗算法118
5.2.2eclat算法121
5.2.3可視化關聯規則123
5.2.4實施關聯規則124
小結126
第6章聚類電商數據127
6.1理解客戶分類128
6.1.1為何理解客戶分類很重要128
6.1.2如何對客戶進行分類128
6.2各種適用的聚類方法129
6.2.1K均值聚類130
6.2.2層次聚類135
6.2.3基於模型的聚類139
6.2.4其他聚類算法140
6.2.5聚類方法的比較143
參考文獻143
小結143
第7章構建零售推薦引擎144
7.1什麼是推薦144
7.1.1商品推薦類型145
7.1.2實現推薦問題的方法145
7.2前提假設147
7.3什麼時候採用什麼方法148
7.4協同過濾的局限149
7.5實際項目149
小結157
第8章降維158
8.1為什麼降維158
8.2降維實際項目161
8.3有參數法降維172
參考文獻173
小結173
第9章神經網絡在醫療數據中的應用174
9.1神經網絡引論174
9.2理解神經網絡背後的數學原理176
9.3用R語言實現神經網絡177
9.4應用神經網絡進行預測180
9.5應用神經網絡進行分類183
9.6應用神經網絡進行預測185
9.7神經網絡的優缺點187

 

參考文獻187
小結187