買這商品的人也買了...
相關主題
商品描述
本書是一本資料科學的入門與提升教程,全書共5篇,依照由淺入深、
循序漸進的方式介紹R語言的基本語法與實際應用,並結合現實資料進行實戰操作。
內容涵蓋R語言的安裝與運作、資料物件的創建與程式設計、R語言初級與高階繪圖、資料的管理與清洗、
統計分析與資料降維、無監督與監督學習、利用R Markdown創建動態報告和製作投影片等。
本書為讀者提供了相關案例的源碼(取得方式見封底)。
本書適合對資料視覺化、統計建模、資料分析、資料探勘有興趣的研究人員和工程技術人員閱讀,
也可作為高等院校數學、統計學、資料科學、電腦科學、人工智能、雲端運算、
大數據分析、生物醫學、工業統計等方向本科生或研究生的參考教程。
作者簡介
薛震,博士,中北大學優秀青年主講教師,山西省高校數學類專業教學指導委員會秘書長,全國數學微課競賽山西賽區秘書長。現主要從事數據統計分析、機器學習和計算機視覺等方面的研究。主持和參與多項省、校級教改項目,獲省級教學成果獎2項。曾榮獲全國“公益雲圖數據可視化創新大賽”優秀導師獎。近年來指導大學生數學建模競賽,獲國內、國際一、二等獎10餘項。
目錄大綱
前言
第一篇 R語言入門
第1章 R語言簡介/
1.1R語言的下載與運行/
1.2RStudio安裝與設置/
1.3R語言包/
1.4數據類型與運算符/
1.5運行R語言代碼/
1.6本章小結/
第2章 R語言數據對象/
2.1向量/
2.1.1數值型/
2.1.2邏輯型/
2.1.3缺失值/
2.1.4字符型/
2.1.5因子型/
2.1.6類型轉換/
2.2矩陣與高維數組/
2.2.1矩陣/
2.2.2高維數組/
2.3數據框/
2.3.1生成數據框/
2.3.2數據框操作/
2.4列表/
2.4.1生成列表/
2.4.2列表操作/
2.5時間數據/
2.5.1基礎包處理時間數據/
2.5.2lubridate包處理時間數據/
2.6本章小結/
第3章 程序編寫與函數/
3.1條件判斷語句/
3.1.1if語句/
3.1.2ifelse語句/
3.2循環語句/
3.2.1for循環/
3.2.2while循環/
3.2.3repeat循環/
3.3內置函數/
3.3.1常用的數學函數/
3.3.2常用的字符串處理函數/
3.3.3常用的統計函數/
3.4自定義函數/
3.4.1函數語法/
3.4.2函數編寫/
3.4.3函數調試/
3.5本章小結/
第二篇 R語言數據整理實戰
第4章 數據讀寫與管理/
4.1數據導入與保存/
4.2從文件中導入數據/
4.2.1導入帶有分隔符的數據/
4.2.2導入Excel表格數據/
4.2.3導入SPSS數據/
4.2.4導入SAS數據/
4.2.5導入MATLAB數據/
4.2.6導入Stata數據/
4.2.7使用RStudio菜單導入數據/
4.3網絡爬蟲爬取數據/
4.3.1從網頁中獲取鏈接和表格/
4.3.2從網頁中獲取文本/
4.3.3從網頁中獲取圖片/
4.4圖像數據管理/
4.4.1讀取圖像/
4.4.2圖像操作/
4.5數據並行計算/
4.5.1apply()函數的使用/
4.5.2lapply()函數的使用/
4.5.3sapply()和vapply()函數的使用/
4.5.4tapply()和mapply()函數的使用/
4.6本章小結/
第5章 數據清洗與操作/
5.1處理缺失值/
5.1.1發現缺失值/
5.1.2缺失值分佈可視化/
5.1.3缺失值填補/
5.2dplyr數據操作/
5.2.1管道操作/
5.2.2數據選擇/
5.2.3數據過濾/
5.2.4數據修改/
5.2.5數據排序/
5.2.6數據分組/
5.2.7數據融合/
5.3長寬數據轉換/
5.3.1tidyr包長寬數據轉換/
5.3.2reshape2包長寬數據轉換/
5.4文本處理/
5.4.1正則表達式/
5.4.2stringr包文本操作/
5.4.3中文文本預處理/
5.5本章小結/目錄
第三篇 R語言數據可視化實戰
第6章 R語言基礎繪圖/
6.1圖形的基礎設置/
6.1.1圖形的形狀和線條/
6.1.2圖形的坐標系/
6.1.3圖形的顏色/
6.1.4圖形的文本/
6.2基礎圖形可視化/
6.2.1散點圖與線圖/
6.2.2直方圖與條形圖/
6.2.3箱線圖與平滑散點圖/
6.2.4三維圖形/
6.3子圖可視化/
6.3.1圖形窗口設計/
6.3.2繪制子圖/
6.4本章小結/
第7章 ggplot2數據可視化/
7.1ggplot2簡介/
7.1.1圖形語法/
7.1.2qplot快速繪圖/
7.2使用圖層構建圖形/
7.2.1幾何對象/
7.2.2theme函數/
7.2.3統計變換/
7.2.4位置調整/
7.2.5形狀和大小/
7.3ggplot2可視化進階/
7.3.1主題/
7.3.2顏色/
7.3.3分面/
7.3.4坐標系/
7.3.5可視化地圖/
7.4ggplot2數據可視化案例/
7.5本章小結/
第8章 R語言高級繪圖/
8.1plotly可交互圖形可視化/
8.1.1可交互統計圖/
8.1.2可交互圖形添加控件/
8.1.3製作可交互動畫/
8.2ggplot2拓展包可視化/
8.2.1cowplot包可視化/
8.2.2ggfortify包可視化/
8.2.3ComplexUpset包可視化/
8.3特殊圖形可視化/
8.3.1圓環條形圖/
8.3.2弧形圖/
8.4本章小結/
第四篇 R語言數據建模實戰
第9章 基礎統計分析/
9.1概率分佈與抽樣/
9.1.1隨機數生成/
9.1.2概率分佈/
9.1.3數據抽樣/
9.2數據描述性統計/
9.2.1數據的變量類型/
9.2.2數據描述匯總/
9.2.3頻數和列聯表/
9.3數據相關性分析/
9.3.1Pearson相關性系數/
9.3.2Spearman秩相關性系數/
9.3.3Kendall相關性系數/
9.4假設檢驗/
9.4.1數據分佈檢驗/
9.4.2t檢驗/
9.5方差分析/
9.5.1單因素方差分析/
9.5.2雙因素方差分析/
9.5.3多變量方差分析/
9.6本章小結/
第10章 回歸分析/
10.1一元線性回歸/
10.1.1一元線性回歸模型/
10.1.2一元線性回歸實例/
10.2一元非線性回歸/
10.2.1多項式回歸/
10.2.2非線性最小二乘回歸/
10.2.3樣條模型/
10.3多元線性回歸/
10.3.1回歸模型的建立/
10.3.2回歸診斷/
10.3.3異常值分析/
10.3.4改進回歸模型/
10.4逐步回歸/
10.4.1直接逐步回歸/
10.4.2剔除異常值逐步回歸/
10.5邏輯回歸/
10.5.1用邏輯回歸進行數據分類/
10.5.2逐步邏輯回歸分析/
10.6本章小結/
第11章 特徵提取與降維/
11.1主成分分析/
11.1.1判斷主成分的個數/
11.1.2提取主成分得分/
11.1.3主成分得分系數/
11.1.4核主成分分析/
11.2因子分析/
11.2.1確定因子個數/
11.2.2提取公共因子/
11.3多維尺度分析/
11.3.1MDS數據降維/
11.3.2計算樣本的空間位置/
11.4tSNE降維/
11.4.1tSNE數據降維案例/
11.4.2調整tSNE算法的困惑度/
11.5本章小結/
第五篇 R語言數據挖掘實戰
第12章 無監督學習/
12.1聚類分析/
12.1.1選擇合適的聚類數目/
12.1.2K均值與K中值聚類/
12.1.3層次聚類/
12.1.4密度聚類/
12.1.5模糊聚類/
12.2離群點檢測/
12.2.1LOF離群點檢測/
12.2.