R在語言科學研究中的應用
吳詩玉
- 出版商: 科學出版
- 出版日期: 2021-10-01
- 定價: $528
- 售價: 8.5 折 $449
- 語言: 簡體中文
- 頁數: 258
- 裝訂: 平裝
- ISBN: 7030694112
- ISBN-13: 9787030694119
-
相關分類:
R 語言、Data Science
立即出貨 (庫存=1)
買這商品的人也買了...
-
$352R語言數據分析項目精解:理論、方法、實戰
-
$284$269 -
$517$491 -
$296應用多元統計分析 (R語言版)
-
$213$203 -
$611R語言機器學習實戰
-
$1,008$958 -
$594$564 -
$359$341 -
$354$336 -
$779$740 -
$539$512 -
$419$398 -
$599$569 -
$588$559 -
$474$450 -
$599$569 -
$594$564
相關主題
商品描述
R是天生的數據分析利器,因其在統計建模和數據可視化方面的優勢,它被越來越多的語言學者熟知和使用,已經成為應用語言學、心理語言學、實驗語音學等研究者青睞的重要研究工具。本書在語言學量化研究視域下主要介紹了四個方面內容:①“乾凈、整潔”的數據框的標準;②基於ggplot2的語言數據可視化;③NHST的原理,即如何在語言研究中實現從樣本到總體;④統計推斷的多種應用。本書從訓練數據框操作能力入手,在介紹這四個方面內容時,首先著力解決一些關鍵概念的理解問題,然後提供大量實例,把關鍵概念付諸具體應用。比如,在介紹數據框操作時,既有語言研究中常用的問捲數據處理,也有大量的反應時行為數據(E-prime)處理,這些數據都是基於筆者真實的語言研究項目。每項研究都會涉及上述四個方面內容,因此形成了一些可供後續使用的經驗。
作者簡介
吳詩玉,上海交通大學教授,博士生導師,上海交通大學晨星青年學者,上海市“浦江人才”計劃獲得者;Journal of SecondLanguage Studies(ESCI)聯合執行主編。主要研究方向:應用語言學(二語習得、外語教學、第二語言加工)、心理語言學、R數據處理。在SSCI和CSSCI期刊發表40餘篇研究論文,出版《第二語言加工及R語言應用》,The Use of L1 Cognitive Resources in L2Reading by Chinese EFL Learners (Routledge,Taylor & Francis Group)等5部著作。主持國家社科基金等
目錄大綱
目錄
前言
本書使用說明
第1章 R數據科學:數據框的操作 1
1.1 “乾凈、整潔”的數據框的標準 2
1.2 熟練地使用數據框操作函數 8
1.2.1 gather( )和spread( )的用法 9
1.2.2 separate( )和unite( )的用法 14
1.3 一些基礎正則表達式的知識 22
1.4 數據表合並 34
1.4.1 傳統的變長或變寬的表格合並 34
1.4.2 生成新變量的表格合並 40
1.4.3 不生成新變量的表格合並 46
1.4.4 集操作 50
1.5 數據框運算和操作的五個函數 53
第2章 數據框操作實例:問捲數據處理 61
2.1 案例一:漢語第三人稱代詞的可接受度判斷實驗 61
2.1.1 背景 61
2.1.2 材料 62
2.1.3 程序 63
2.1.4 數據清潔和整理 64
2.1.5 利用最終數據進行描述統計 72
2.2 案例二:英語第三人稱代詞的可接受度判斷實驗 77
2.2.1 背景 77
2.2.2 材料 79
2.2.3 程序 80
2.2.4 數據清潔和整理 81
2.2.5 利用最終數據進行描述統計 93
第3章 數據框操作實例:反應時行為數據處理 97
3.1 背景 98
3.1.1 被試 98
3.1.2 材料 99
3.1.3 程序 100
3.2 E-prime數據清潔和整理 100
3.3 RStudio數據清潔和整理 104
3.4 總結 118
第4章 概率分佈 121
4.1 介紹 121
4.2 離散變量分佈 123
4.3 連續變量分佈:正態分佈,t分佈、F分佈和X2分佈 127
4.3.1 正態分佈 127
4.3.2 t分佈、F分佈和X2分佈 135
第5章 假設檢驗的原理 141
5.1 正態分佈視域下的NHST 142
5.2 t分佈、F分佈以及X2分佈視域下的NHST 149
5.3 總結 157
第6章 ggplot2作圖 161
6.1 與實驗數據關聯的作圖知識 162
6.1.1 基礎圖形語法 162
6.1.2 分頁 174
6.1.3 著色 185
6.1.4 圖例修改 191
6.2 實驗數據之外的作圖知識 196
6.2.1 theme系統 197
6.2.2 坐標體系、註解和繪制函數 205
第7章 實驗設計、t檢驗、方差分析和回歸模型 211
7.1 實驗研究和實驗設計 211
7.1.1 描述性研究 211
7.1.2 相關研究 212
7.1.3 界定變量之間關系的研究 214
7.1.4 實驗設計 216
7.1.5 拉丁方實驗設計 219
7.2 t檢驗 222
7.2.1 單樣本t檢驗 222
7.2.2 獨立樣本t檢驗 226
7.2.3 配對樣本t檢驗 228
7.2.4 t檢驗的效應量 230
7.2.5 t檢驗的統計假設的前提 234
7.3 方差分析 235
7.3.1 獨立測量的單向方差分析 235
7.3.2 重復測量的單向方差分析 239
7.3.3 多自變量方差分析 244
7.4 統計模型 252
7.5 總結 255
參考文獻 257