R語言實戰 資料整理、視覺化、建模與挖掘

薛震 孫玉林

  • 出版商: 機械工業
  • 出版日期: 2024-07-18
  • 售價: $954
  • 貴賓價: 9.5$906
  • 語言: 簡體中文
  • 頁數: 384
  • 裝訂: 平裝
  • ISBN: 7111757211
  • ISBN-13: 9787111757214
  • 相關分類: R 語言
  • 立即出貨

商品描述

本書是一本資料科學的入門與提升教程,全書共5篇,依照由淺入深、
循序漸進的方式介紹R語言的基本語法與實際應用,並結合現實資料進行實戰操作。
內容涵蓋R語言的安裝與運作、資料物件的創建與程式設計、R語言初級與高階繪圖、資料的管理與清洗、
統計分析與資料降維、無監督與監督學習、利用R Markdown創建動態報告和製作投影片等。
本書為讀者提供了相關案例的源碼(取得方式見封底)。
本書適合對資料視覺化、統計建模、資料分析、資料探勘有興趣的研究人員和工程技術人員閱讀,
也可作為高等院校數學、統計學、資料科學、電腦科學、人工智慧、雲端運算、
大數據分析、生物醫學、工業統計等方向本科生或研究生的參考教程。

目錄大綱

前言
第一篇 R语言入门
第1章 R语言简介/
1.1R语言的下载与运行/
1.2RStudio安装与设置/
1.3R语言包/
1.4数据类型与运算符/
1.5运行R语言代码/
1.6本章小结/
第2章 R语言数据对象/
2.1向量/
2.1.1数值型/
2.1.2逻辑型/
2.1.3缺失值/
2.1.4字符型/
2.1.5因子型/
2.1.6类型转换/
2.2矩阵与高维数组/
2.2.1矩阵/
2.2.2高维数组/
2.3数据框/
2.3.1生成数据框/
2.3.2数据框操作/
2.4列表/
2.4.1生成列表/
2.4.2列表操作/
2.5时间数据/
2.5.1基础包处理时间数据/
2.5.2lubridate包处理时间数据/
2.6本章小结/
第3章 程序编写与函数/
3.1条件判断语句/
3.1.1if语句/
3.1.2ifelse语句/
3.2循环语句/
3.2.1for循环/
3.2.2while循环/
3.2.3repeat循环/
3.3内置函数/
3.3.1常用的数学函数/
3.3.2常用的字符串处理函数/
3.3.3常用的统计函数/
3.4自定义函数/
3.4.1函数语法/
3.4.2函数编写/
3.4.3函数调试/
3.5本章小结/
第二篇 R语言数据整理实战
第4章 数据读写与管理/
4.1数据导入与保存/
4.2从文件中导入数据/
4.2.1导入带有分隔符的数据/
4.2.2导入Excel表格数据/
4.2.3导入SPSS数据/
4.2.4导入SAS数据/
4.2.5导入MATLAB数据/
4.2.6导入Stata数据/
4.2.7使用RStudio菜单导入数据/
4.3网络爬虫爬取数据/
4.3.1从网页中获取链接和表格/
4.3.2从网页中获取文本/
4.3.3从网页中获取图片/
4.4图像数据管理/
4.4.1读取图像/
4.4.2图像操作/
4.5数据并行计算/
4.5.1apply()函数的使用/
4.5.2lapply()函数的使用/
4.5.3sapply()和vapply()函数的使用/
4.5.4tapply()和mapply()函数的使用/
4.6本章小结/
第5章 数据清洗与操作/
5.1处理缺失值/
5.1.1发现缺失值/
5.1.2缺失值分布可视化/
5.1.3缺失值填补/
5.2dplyr数据操作/
5.2.1管道操作/
5.2.2数据选择/
5.2.3数据过滤/
5.2.4数据修改/
5.2.5数据排序/
5.2.6数据分组/
5.2.7数据融合/
5.3长宽数据转换/
5.3.1tidyr包长宽数据转换/
5.3.2reshape2包长宽数据转换/
5.4文本处理/
5.4.1正则表达式/
5.4.2stringr包文本操作/
5.4.3中文文本预处理/
5.5本章小结/目录
第三篇 R语言数据可视化实战
第6章 R语言基础绘图/
6.1图形的基础设置/
6.1.1图形的形状和线条/
6.1.2图形的坐标系/
6.1.3图形的颜色/
6.1.4图形的文本/
6.2基础图形可视化/
6.2.1散点图与线图/
6.2.2直方图与条形图/
6.2.3箱线图与平滑散点图/
6.2.4三维图形/
6.3子图可视化/
6.3.1图形窗口设计/
6.3.2绘制子图/
6.4本章小结/
第7章 ggplot2数据可视化/
7.1ggplot2简介/
7.1.1图形语法/
7.1.2qplot快速绘图/
7.2使用图层构建图形/
7.2.1几何对象/
7.2.2theme函数/
7.2.3统计变换/
7.2.4位置调整/
7.2.5形状和大小/
7.3ggplot2可视化进阶/
7.3.1主题/
7.3.2颜色/
7.3.3分面/
7.3.4坐标系/
7.3.5可视化地图/
7.4ggplot2数据可视化案例/
7.5本章小结/
第8章 R语言高级绘图/
8.1plotly可交互图形可视化/
8.1.1可交互统计图/
8.1.2可交互图形添加控件/
8.1.3制作可交互动画/
8.2ggplot2拓展包可视化/
8.2.1cowplot包可视化/
8.2.2ggfortify包可视化/
8.2.3ComplexUpset包可视化/
8.3特殊图形可视化/
8.3.1圆环条形图/
8.3.2弧形图/
8.4本章小结/
第四篇 R语言数据建模实战
第9章 基础统计分析/
9.1概率分布与抽样/
9.1.1随机数生成/
9.1.2概率分布/
9.1.3数据抽样/
9.2数据描述性统计/
9.2.1数据的变量类型/
9.2.2数据描述汇总/
9.2.3频数和列联表/
9.3数据相关性分析/
9.3.1Pearson相关性系数/
9.3.2Spearman秩相关性系数/
9.3.3Kendall相关性系数/
9.4假设检验/
9.4.1数据分布检验/
9.4.2t检验/
9.5方差分析/
9.5.1单因素方差分析/
9.5.2双因素方差分析/
9.5.3多变量方差分析/
9.6本章小结/
第10章 回归分析/
10.1一元线性回归/
10.1.1一元线性回归模型/
10.1.2一元线性回归实例/
10.2一元非线性回归/
10.2.1多项式回归/
10.2.2非线性最小二乘回归/
10.2.3样条模型/
10.3多元线性回归/
10.3.1回归模型的建立/
10.3.2回归诊断/
10.3.3异常值分析/
10.3.4改进回归模型/
10.4逐步回归/
10.4.1直接逐步回归/
10.4.2剔除异常值逐步回归/
10.5逻辑回归/
10.5.1用逻辑回归进行数据分类/
10.5.2逐步逻辑回归分析/
10.6本章小结/
第11章 特征提取与降维/
11.1主成分分析/
11.1.1判断主成分的个数/
11.1.2提取主成分得分/
11.1.3主成分得分系数/
11.1.4核主成分分析/
11.2因子分析/
11.2.1确定因子个数/
11.2.2提取公共因子/
11.3多维尺度分析/
11.3.1MDS数据降维/
11.3.2计算样本的空间位置/
11.4tSNE降维/
11.4.1tSNE数据降维案例/
11.4.2调整tSNE算法的困惑度/
11.5本章小结/
第五篇 R语言数据挖掘实战
第12章 无监督学习/
12.1聚类分析/
12.1.1选择合适的聚类数目/
12.1.2K均值与K中值聚类/
12.1.3层次聚类/
12.1.4密度聚类/
12.1.5模糊聚类/
12.2离群点检测/
12.2.1LOF离群点检测/
12.2.