R語言與數據挖掘 R语言与数据挖掘

張良均, 謝佳標, 楊坦, 肖剛

  • 出版商: 機械工業
  • 出版日期: 2016-06-01
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • 頁數: 302
  • 裝訂: 平裝
  • ISBN: 7111540522
  • ISBN-13: 9787111540526
  • 相關分類: R 語言
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

商品描述

<內容介紹>

張良均、謝佳標、楊坦、肖剛著的《R語言與數據挖掘》是一本適合教學和零基礎自學的R語言與數據挖掘教程,即便完全沒有R語言編程基礎和數據挖掘基礎,根據本書中的理論知識和上機實踐,你也能迅速掌握如何使用R語言進行數據挖掘的方法。本書已經被多所高校預定為教材,為了便於教學,書中還提供了大量的上機實驗和教學資源。
    基礎篇(1?5章),主要包括R語言及圖形操作工具RStudio的安裝及使用方法,數據類型和數據對象,數據預處理的常用操作(包括數據重命名、缺失值分析、排序、隨機抽樣等),繪圖功能(包括散點圖、直方圖、條形圖、箱線圖等)。
    建模應用篇(6?10章),主要介紹了數據挖掘中常用演算法的函數在R語言中的使用方法及其結果,涵蓋了目前數據挖掘的5大類演算法,包括分類與預測、聚類分析、關聯規則、智能推薦和時間序列。按照從模型建立到模型評價架構的順序進行介紹,使讀者能熟練地掌握從建模到對模型評價的完整建模過程。
    Rattle篇(11章),介紹了R語言的圖形界面工具Rattle,此工具能夠在一個圖形化的界面上對本書所介紹的R語言功能進行操作,使讀者能更好地體驗到使用R語言進行數據挖掘的整個流程。
    書中配套提供了原始樣本數據文件及對應章節示例代碼。每個章節有對應的練習實驗,讀者可通過完成對應的練習,迅速掌握R語言的用法和數據挖掘的方法。

 

<章節目錄>
前言
第一部分  基礎篇
第1章  R語言的安裝與使用
  1.1  R安裝與升級
  1.2  R使用入門
    1.2.1  R操作界面
    1.2.2  RStudio窗口介紹
    1.2.3  R常用操作
  1.3  R數據分析包
  1.4  配套資源使用說明
  1.5  小結
  1.6  上機實驗
第2章  數據對象與數據讀寫
  2.1  數據類型
  2.2  數據結構
    2.2.1  向量
    2.2.2  矩陣
    2.2.3  數組
    2.2.4  數據框
    2.2.5  因子
    2.2.6  列表
  2.3  數據文件的讀寫
    2.3.1  鍵盤輸入數據
    2.3.2  讀取不同格式的數據
    2.3.3  從其他統計軟件獲取數據
    2.3.4  從數據庫獲取數據
    2.3.5  從網頁獲取數據
  2.4  小結
  2.5  上機實驗
第3章  R語言常用數據管理
  3.1  變量的重命名
  3.2  缺失值分析
  3.3  數據排序
  3.4  隨機抽樣
  3.5  數值運算函數
  3.6  字符串處理
  3.7  文本分詞
  3.8  apply函數族
  3.9  數據整合
  3.10  控制流
  3.11  函數的編寫
  3.12  小結
  3.13  上機實驗
第4章  圖形探索
  4.1  圖形元素
    4.1.1  顏色
    4.1.2  點
    4.1.3  文本
    4.1.4  線條
    4.1.5  圖例

    4.1.6  坐標軸
  4.2  圖形組合
  4.3  圖形保存
  4.4  圖形函數
  4.5  小結
  4.6  上機實驗
第5章  高級繪圖工具
  5.1  lattice包繪圖工具
    5.1.1  繪圖特色
    5.1.2  基本圖形
  5.2  ggplot2包繪圖工具
    5.2.1  從qplot開始
    5.2.2  ggplot作圖
  5.3  交互式繪圖工具簡介
    5.3.1  rCharts包
    5.3.2  recharts包
    5.3.3  googleVis包
    5.3.4  htmlwidgets包
    5.3.5  shiny包
  5.4  小結
  5.5  上機實驗
第二部分  建模應用篇
第6章  分類與預測
  6.1  回歸分析
  6.2  決策樹
    6.2.1  C4.5演算法
    6.2.2  CART演算法
    6.2.3  C5.0演算法
  6.3  人工神經網絡
  6.4  KNN演算法
  6.5  樸素貝葉斯分類
  6.6  其他分類與預測演算法函數
  6.7  分類與預測演算法評價
  6.8  小結
  6.9  上機實驗
第7章  聚類分析
  7.1  K-Means聚類分析函數
  7.2  層次聚類演算法
  7.3  其他聚類分析函數
  7.4  小結
  7.5  上機實驗
第8章  關聯規則
  8.1  Apriori關聯規則
  8.2  小結
  8.3  上機實驗
第9章  智能推薦
  9.1  智能推薦模型構建
  9.2  智能推薦模型評價
  9.3  小結
  9.4  上機實驗

第10章  時間序列
    10.1  ARIMA模型
    10.2  其他時間序列模型
    10.3  小結
  10.4  上機實驗
第三部分  Rattle篇
第11章  可視化數據挖掘工具
  11.1  Rattle簡介及其安裝
    11.1.1  Rattle簡介
    11.1.2  Rattle安裝
  11.2  功能預覽
  11.3  數據導入
    11.3.1  導入CSV數據
    11.3.2  導入ARFF數據
    11.3.3  導入ODBC數據
    11.3.4  R Dataset——導入其他數據源
    11.3.5  導入RData File數據集
    11.3.6  導入Library數據
  11.4  數據探索
    11.4.1  數據總體概況
    11.4.2  數據分佈探索
    11.4.3  相關性
    11.4.4  主成分
    11.4.5  交互圖
  11.5  數據建模
    11.5.1  聚類分析
    11.5.2  關聯規則
    11.5.3  決策樹
    11.5.4  隨機森林
  11.6  模型評估
    11.6.1  混淆矩陣
    11.6.2  風險圖
    11.6.3  ROC圖及相關圖表
    11.6.4  模型得分數據集
  11.7  小結
  11.8  上機實驗
參考資料