R速成:統計分析和科研數據分析快速上手

莊亮亮,趙子茜

買這商品的人也買了...

商品描述

本書的特色在於結合實際案例來展現R在數據科學領域的靈活性,不僅能讓讀者學習統計知識,也能提升代碼編寫能力。全書共15章,第1章詳細介紹了R和RStudio的安裝方法;第2章至第3章介紹了導入數據的方法,以及R的基本工作原理;第4章介紹了R中重要的數據管理方法;第5章講解數據可視化的知識;第6章至第15章,每一章對應了一個統計知識點,包括描述性統計、簡單線性回歸、多元線性回歸、虛擬變量回歸、Logistic回歸、多層次和縱向分析、因子分析等。 為方便讀者學習,本書提供了astatur包,這個工具包涵蓋了本書中使用的所有數據集,以及相關章節中提到的一些補充函數。此外,本書沒有過多地介紹復雜的數學公式,對於必備知識點使用了盡可能通俗的語言進行講解,因此本書適合作為R統計分析課程的教科書,也適合數據分析初學者參考學習。

目錄大綱

目錄
第1 章 R 簡介 . 1
1.1 R 是什麽?為什麽要使用R? . 2
1.2 RStudio 是什麽? . 5
1.3 如何安裝R 和RStudio? . 6
1.3.1 在Windows 上使用R 6
1.3.2 在Mac 上使用R . 7
1.3.3 在Linux 上使用R . 7
1.3.4 在Windows、macOS 和Linux 上使用RStudio 8
1.4 瞭解 RStudio . 9
1.4.1 腳本窗口 . 9
1.4.2 控制台窗口 11
1.4.3 環境窗口 11
1.4.4 圖形窗口 . 12
1.5 R 的線上資源 . 13
1.6 R 包的作用 . 15
1.7 更新R、RStudio 和R 包 . 17
1.8 本章小結 18

第2 章 在R 中導入和處理數據 21
2.1 如何在R 中表示數據集? . 22
2.2 在R 中導入數據 23
2.3 在R 中輸入數據 29
2.4 如何在R 中使用數據集? . 33
2.5 數據類型 35
2.6 本章小結 39

第3 章 R 是怎樣工作的? . 42
3.1 R 的工作方式 . 43
3.2 函數是什麽? . 44
3.3 對象是什麽? . 47
3.3.1 向量 . 48
3.3.2 數據框 . 51
3.3.3 矩陣 . 57
3.3.4 列表 . 58
3.4 本章小結 60

第4 章 數據管理 . 63
4.1 變量的數據管理 . 64
4.1.1 創建新變量 . 64
4.1.2 重新編碼變量 67
4.1.3 替換變量值 . 69
4.1.4 重命名變量 . 72
4.1.5 探索缺失值 . 73
4.1.6 生成虛擬變量 77
4.1.7 修改變量的數據類型 79
4.1.8 標簽變量 . 80
4.1.9 整理分類變量 81
4.2 對數據集進行數據管理 82
4.2.1 變量的選擇和排除 82
4.2.2 選擇觀察值 . 85
4.2.3 根據變量合並數據集 87
4.2.4 根據觀察值合並數據集. 89
4.2.5 對數據集排序 90
4.2.6 重塑數據集 . 91
4.2.7 給變量排序 . 92
4.2.8 從數據集中隨機抽取樣本 . 94
4.2.9 管道 . 95
4.3 本章小結 96

第5 章 用ggplot2 實現數據可視化 100
5.1 可視化在數據分析中的作用 .101
5.2 瞭解ggplot2 103
5.2.1 層的結構 104
5.2.2 影響所有層的附加組件 114
5.3 R 示例圖 .122
5.3.1 單變量圖 123
5.3.2 二元圖 129
5.3.3 多元圖 132
5.4 本章小結 .133

第6 章 描述性統計 137
6.1 單變量分析 .139
6.1.1 集中趨勢的度量 .140
6.1.2 散佈的度量 143
6.1.3 偏度和峰度 147
6.1.4 離散分佈 149
6.1.5 快速描述性分析 .152
6.2 描述變量之間的關系 157
6.2.1 相關系數 157
6.2.2 交叉表 161
6.3 分析組間變量 162
6.4 本章小結 .166

第7 章 簡單線性回歸 169
7.1 什麽是回歸分析 170
7.2 簡單線性回歸分析 171
7.2.1 普通最小二乘法 .173
7.2.2 擬合優度 175
7.2.3 回歸系數的假設檢驗 .178
7.2.4 線性回歸預測 .181
7.3 R 語言實例 181
7.4 本章小結 .185

第8 章 多元線性回歸 188
8.1 多元線性回歸分析 189
8.1.1 參數估計 189
8.1.2 擬合優度和F 檢驗 .190
8.1.3 調整的R2 .191
8.1.4 偏斜系數 192
8.1.5 使用多元線性回歸進行預測 193
8.1.6 標準化和相對重要程度194
8.1.7 回歸假設和診斷 .195
8.2 R 語言實例 196
8.3 本章小結 .208

第9 章 虛擬變量回歸 . 211
9.1 為什麽要進行虛擬變量回歸? .212
9.1.1 創建虛擬變量 .212
9.1.2 虛擬變量回歸背後的邏輯 214
9.2 單一虛擬變量回歸 214
9.3 一個虛擬變量和一個協變量的回歸 217
9.4 多虛擬變量回歸 220
9.4.1 R 語言實例 .222
9.4.2 比較組間差異 .224
9.4.3 成對多重比較調整 .228
9.5 有一個以上虛擬變量和一個協變量的回歸.230
9.6 兩組獨立虛擬變量的回歸 .232
9.7 本章小結 .237

第10 章 使用回歸法進行調節/交互分析 . 240
10.1 交互作用/調節效應 .241
10.2 乘積-項方法 242
10.3 連續預測變量與虛擬調節變量的交互作用 .244
10.4 連續預測變量和連續調節變量之間的交互作用 .248
10.5 虛擬預測變量與虛擬調節變量的交互作用 .253
10.6 連續預測變量與多分類調節變量的交互作用 .256
10.7 其他註意事項 261
10.7.1 顯著與不顯著的交互作用 261
10.7.2 中心化和標準化 .261
10.8 本章小結 .262

第11 章 Logistic 回歸 265
11.1 R 實現簡單Logistic 回歸 269
11.1.1 Logistic 回歸中系數的含義 272
11.1.2 擬合優度和模型選擇 276
11.2 多重邏輯回歸 278
11.3 Logistic 回歸進行分類 287
11.4 本章小結 .293

第12 章 多層次和縱向分析 . 296
12.1 嵌套數據結構的表示 298
12.2 完全、部分和無聚集 303
12.3 線性混合模型的顯著性檢驗 .310
12.4 縱向混合模型的模型比較 .317
12.5 本章小結 .321

第13 章 因子分析 . 324
13.1 什麽是因子分析? 325
13.2 因子分析過程 327
13.2.1 確定因子的數量 .328
13.2.2 因子提取 329
13.2.3 因子旋轉 332
13.2.4 提煉和解釋因子 .334
13.3 綜合評分和信度檢驗 335
13.4 R 語言實例 337
13.4.1 確定因子的數量 .337
13.4.2 用旋轉法提取因子 .339
13.5 本章小結 .343

第14 章 結構方程模型 347
14.1 什麽是結構方程模型? .348
14.2 確認性因子分析 350
14.2.1 模型設定 351
14.2.2 模型識別 352
14.2.3 參數估計 354
14.2.4 模型評估 355
14.2.5 模型修正 362
14.3 潛在路徑分析 365
14.3.1 LPA 模型的定義 .366
14.3.2 測量部分 366
14.3.3 結構部分 370
14.4 本章小結 .372

第15 章 貝葉斯統計 377
15.1 貝葉斯數據分析 380
15.2 用R 實現貝葉斯數據分析 381
15.3 R 語言實例 383
15.3.1 模型診斷 384
15.3.2 回歸系數的貝葉斯估計 386
15.3.3 貝葉斯模型的選擇 .391
15.3.4 模型檢驗 395
15.3.5 先驗分佈的選擇 .397
15.4 本章小結 .400