預測分析:R語言實現 预测分析:R语言实现

魯伊·米格爾·福特 (Rui Miguel Forte)

下單後立即進貨 (約4週~6週)

買這商品的人也買了...

相關主題

商品描述

<內容簡介>

R提供了一個免費、開源的環境,這對於學習預測建模以及在真實環境下部署解決方案是很理想的。隨著不斷增長的社區和大量擴展包的出現,R提供了一個應對一系列問題的切實解決方案。本書可以作為學習預測建模基礎知識的指南和參考讀物。本書的開篇是關於模型術語和預測建模過程的一個專門章節。後續的每個章節會講解具體的一類模型(例如神經網絡),並把重點放在三個重要問題上:模型如何工作,如何利用R語言訓練模型,以及如何利用實際環境下的數據集來衡量和評估模型的性能。通過閱讀本書,讀者將利用實際環境下的數據集探討和測試流行的建模技術,並掌握多種預測分析領域的技術。

<章節目錄>

譯者序

前言

第1章準備預測建模
1.1模型
1.1.1從數據中學習
1.1.2模型的核心組成部分
1.1.3我們的第一個模型:k近鄰
1.2模型的類型
1.2.1有監督、無監督、半監督和強化學習模型
1.2.2參數化和非參數化模型
1.2.3回歸和分類模型
1.2.4實時和批處理機器學習模型
1.3預測建模的過程
1.3.1定義模型的目標
1.3.2收集數據
1.3.3選取模型
1.3.4數據的預處理
1.3.5特徵工程和降維
1.3.6訓練和評估模型
1.3 .7重複嘗試不同模型及模型的最終選擇
1.3.8部署模型
1.4性能衡量指標
1.4.1評估回歸模型
1.4.2評估分類模型
1.5小結

第2章線性回歸
2.1線性回歸入門
2.2簡單線性回歸
2.3多元線性回歸
2.3.1預測CPU性能
2.3.2預測二手汽車的價格
2.4評估線性回歸模型
2.4.1殘差分析
2.4.2線性回歸的顯著性檢驗
2.4.3線性回歸的性能衡量指標
2.4.4比較不同的回歸模型
2.4.5在測試集上的性能
2.5線性回歸的問題
2.5.1多重共線性
2.5.2離群值
2.6特徵選擇
2.7正則化
2.7.1嶺回歸
2.7.2最小絕對值收縮和選擇算子
2.7.3在R語言裡實現正則化
2.8小結

第3章邏輯回歸
3.1利用線性回歸進行分類
3.2邏輯回歸入門
3.2.1廣義線性模型
3.2.2解釋邏輯回歸中的係數
3.2.3邏輯回歸的假設
3.2.4最大似然估計
3.3預測心髒病
3.4評估邏輯回歸模型
3.4.1模型的偏差
3.4.2測試集的性能
3.5利用lasso進行正則化
3.6分類指標
3.7二元邏輯分類器的擴展
3.7.1多元邏輯回歸
3.7.2有序邏輯回歸
3.8小結

第4章神經網絡
4.1生物神經元
4.2人工神經元
4.3隨機梯度下降
4.3.1梯度下降和局部極小值
4.3.2感知器算法
4.3.3線性分離
4.3 .4邏輯神經元
4.4多層感知器網絡
4.5預測建築物的能源效率
4.6重新進行玻璃類型預測
4.7預測手寫數字
4.8小結

第5章支持向量機
5.1最大邊緣分類
5.2支持向量分類
5.3核和支持向量機
5.4預測化學品的生物降解
5.5交叉驗證
5.6預測信用評分
5.7用支持向量機進行多類別分類
5.8小結

第6章樹形方法
6.1樹形模型的直觀印象
6.2訓練決策樹的算法
6.2.1分類和回歸樹
6.2.2回歸模型樹
6.2.3 CART分類樹
6.2.4 C5.0
6.3在合成的二維數據上預測類別歸屬關係
6.4預測紙幣的真實性
6.5預測複雜的技能學習
6.5.1在CART樹里對模型參數進行調優
6.5.2樹模型中的變量重要性
6.5.3回歸模型樹實用示例
6.6小結

第7章集成方法
7.1裝袋
7.1.1邊緣和袋外觀測數據
7.1.2用裝袋預測複雜技能學習
7.1.3用裝袋預測心髒病
7.1.4裝袋的局限性
7.2增強
7.3預測大氣中伽馬射線的輻射
7.4利用增強算法預測複雜技能學習
7.5隨機森林
7.6小結

第8章概率圖模型
8.1圖論入門
8.2貝葉斯定理
8.3條件性獨立
8.4貝葉斯網絡
8.5樸素貝葉斯分類器
8.6隱馬爾可夫模型
8.7預測啟動子基因序列
8.8預測英語單詞裡的字母特徵
8.9小結

第9章時間序列分析
9.1時間序列的基本概念
9.2一些基本的時間序列
9.2.1白噪聲
9.2.2隨機漫步
9.3平穩性
9.4平穩時間序列模型
9.4.1移動平均模型
9.4.2自回歸模型
9.4.3自回歸移動平均模型
9.5非平穩時間序列模型
9.5.1整合自回歸移動平均模型
9.5.2自回歸條件異方差模型
9.5.3廣義自回歸條件異方差模型
9.6預測強烈地震
9.7預測猞猁的誘捕
9.8預測外匯匯率
9.9其他時間序列模型
9.10小結

第10章主題建模
10.1主題建模概況
10.2隱含狄式分佈
10.2.1狄式分佈
10.2.2生成過程
10.2.3擬合LDA模型
10.3對在線新聞報導的主題進行建模
10.3.1模型穩定性
10.3.2找出主題數量
10.3.3主題分佈
10.3 .4單詞分佈
10.3.5 LDA擴展模型
10.4小結

第11章推薦系統
11.1評分矩陣
11.2協同過濾
11.2.1基於用戶的協同過濾
11.2.2基於商品的協同過濾
11.3奇異值分解
11.4 R語言和大數據
11.5預測電影和笑話的推薦
11.6加載和預處理數據
11.7對數據進行探索
11.7.1評估二元的top-N推薦
11.7.2評估非二元的top -N推薦
11.7.3評估每種預測方法
11.8推薦系統的其他方法
11.9小結