統計學習(回歸視角原書第3版)

馮淩秉

商品描述

本書從回歸分析視角講述統計學習方法,強調在無先驗模型假設下,基於數據驅動的條件分布建模。本書的核心思想是,監督學習可被恰當地視為一種回歸分析形式。遵循現代數據分析理念,本書強調,正確的統計學習數據分析方法依賴於良好的數據收集、巧妙的數據管理、恰當的統計程序以及對結果的可信解釋。書中涵蓋了袋裝法、隨機森林、提升算法、支持向量機、深度學習、強化學習等統計學習的關鍵概念和方法,並結合R語言代碼展示了這些方法的實際應用。另外,本書探討了傳統統計推斷和統計學習之間的關聯與區別,很好地展現了計算機科學與統計學的融合發展與相互碰撞。本書既可以作為統計學、數據科學、人工智能、社會學、心理學和生命科學等專業高年級本科生、研究生的教材,也可以作為希望將統計學習方法應用於科學和政策問題的研究人員的參考讀物

作者簡介

加州大學洛杉磯分校統計系名譽統計學教授,現任賓夕法尼亞大學統計系和犯罪學系教授。他是美國統計協會和美國科學促進會的當選院士,曾在the Committee on Applied and Theoretical Statistics for the National Research Council、the Board of Directors of the Social Science Research Council等多個組織任職。他的研究涉及社會科學和自然科學的各種應用。

目錄大綱

前言
第1章  回歸視角下的統計學習
  1.1  準備開始
  1.2  設定回歸語境
  1.3  重新審視無處不在的線性回歸模型
    1.3.1  實際問題
    1.3.2  回歸的另外一種形式
    1.4.1  關於使用錯誤模型進行統計推斷的進一步探討
    1.4.3  夾心標準誤簡介
    1.4.4  保形推斷簡介
    1.4.5  非參數自舉法簡介
    1.4.6  二元響應變量的錯誤回歸模型
  1.5  向統計學習轉變
    1.5.1  模型與算法
  1.6  一些初步概念
    1.6.1  統計學習的總體目標
    1.6.2  基於監督型統計學習的預測
    1.6.3  過擬合
    1.6.4  數據窺探
    1.6.5  應對過擬合和數據窺探的一些建設性對策
    1.6.6  損失函數及相關概念
    1.6.7  偏差-方差權衡
    1.6.8  線性估計量
    1.6.9  自由度
    1.6.10  基函數
    1.6.11  維度災難
  1.7  統計學習的背景
  示例和練習題
  尾註
  本章參考文獻
第2章  樣條、平滑器和核函數
  2.1  引言
  2.2  回歸樣條
    2.2.1  分段線性總體近似估計
    2.2.2  多項式回歸樣條
    2.2.3  自然三次樣條
    2.2.4  B樣條
  2.3  懲罰平滑
    2.3.1  收縮與正則化
  2.4  懲罰回歸樣條
    2.4.1  一個實際應用
  2.5  平滑樣條
    2.5.1  一個平滑樣條的示例
  2.6  作為平滑方法的局部加權回歸
    2.6.1  最近鄰方法
    2.6.2  局部加權回歸
  2.7  多預測變量的平滑方法
    2.7.1  二維空間的平滑
    2.7.2  廣義加性模型
  2.8  帶有分類變量的平滑算法
    2.8.1  使用廣義加性模型處理二元結果的示例
  2.9  模型選擇後的統計推斷示例
    2.9.1  第一層級分析與第二層級分析的對比總結
  2.10  核化回歸
    2.10.1  徑向基核
    2.10.2  ANOVA徑向基核
    2.10.3  一個核回歸的應用
  2.11  總結與結論
  示例和練習題
  尾註
  本章參考文獻
第3章  回歸與決策樹
  3.1  引言
  3.2  CART中遞歸分割算法的簡介
  3.3  深入探討基本思想
    3.3.1  展示貪婪算法決策的樹狀圖
    3.3.2  一個初步的應用
    3.3.3  基於CART的分類與預測
    3.3.4  混淆矩陣
    3.3.5  作為自適應最近鄰方法的CART
  3.4  節點分裂的形式化處理
  3.5  使用CART進行監獄犯人風險評估的示例
  3.6  分類誤差與成本
    3.6.1  CART中成本的默認值
    3.6.2  先驗概率與相對誤分類成本
  3.7  調整先驗和覆雜度參數
  3.8  一個包含三類響應變量的示例
  3.9  回歸樹
    3.9.1  一個CART應用實例:分析影響高中生GPA的相關因素
  3.10  剪枝
  3.11  缺失數據
    3.11.1  CART中的缺失數據
  3.12  關於CART算法不穩定性的更多討論
  3.13  CART統計推斷總結
    3.13.1  CART預測的統計推斷總結
  3.14  總結與結論
  練習題
  尾註
  本章參考文獻
第4章  袋裝法
  4.1  引言
  4.2  袋裝法算法
  4.3  更多袋裝法的細節
    4.3.1  再探CART不穩定性問題
    4.3.2  袋裝法的重抽樣方法
    4.3.3  樹間投票與概率
    4.3.4  預測與缺失值插補
    4.3.5  袋裝法的估計與統計推斷
    4.3.6  分類的邊際
    4.3.7  使用袋外觀測作為測試數據
    4.3.8  袋裝與偏差
  4.4  袋裝法的一些局限性
    4.4.1  有時袋裝法也無濟於事
    4.4.2  有時袋裝法會加劇估計偏差
    4.4.3  有時袋裝法會加劇估計方差
  4.5  一個袋裝法的示例
  4.6  總結與結論
  練習題
  尾註
  本章參考文獻
第5章  隨機森林
  5.1  引言和總覽
    5.1.1  解析隨機森林的工作原理
  5.2  隨機森林的初步示例
  5.3  一些正式的技術細節
    5.3.1  隨機森林概述
    5.3.2  分類器的邊際與泛化誤差
    5.3.3  隨機森林的泛化誤差
    5.3.4  隨機森林的強度
    5.3.5  依賴性
    5.3.6  總結
  5.4  隨機森林與自適應最近鄰方法
  5.5  引入誤分類成本
    5.5.1  使用非對稱成本的簡要示例
  5.6  確定預測變量的重要性
    5.6.1  對擬合的貢獻
    5.6.2  對預測值的貢獻
  5.7  輸入響應函數
    5.7.1  部分依賴圖示例
    5.7.2  多於兩個響應類別
  5.8  分類與鄰近矩陣
    5.8.1  通過鄰近值進行聚類
  5.9  經驗邊際
  5.10  數值型響應變量
  5.11  使用數值型響應變量的隨機森林示例
  5.12  使用隨機森林進行統計推斷
  5.13  軟件與調參
  5.14  貝葉斯加性回歸樹
  5.15  總結與結論
  練習題
  尾註
  本章參考文獻
第6章  提升算法
  6.1  引言
  6.2  AdaBoost
    6.2.1  AdaBoost.M1的一個簡單數值示例
    6.2.2  為什麼提升算法在分類問題上效果絕佳
  6.3  隨機梯度提升
    6.3.1  梯度提升的正式表達
    6.3.2  隨機梯度提升實戰
    6.3.3  調整參數
    6.3.4  輸出
  6.4  非對稱成本
  6.5  提升算法、估計與一致性
  6.6  一個二項分布的示例
  6.7  用於統計推斷和預測的提升算法
    6.7.1  一個插補的示例
  6.8  一個分位回歸的示例
  6.9  提升算法在觀察性研究中的因果推斷應用
  6.10  總結與結論
  練習題
  尾註
  本章參考文獻
第7章  支持向量機
  7.1  引言
  7.2  圖解支持向量機
    7.2.1  支持向量分量分類器
    7.2.2  支持向量機
  7.3  更正式地介紹支持向量機
    7.3.1  再論支持向量分類器:線性可分情況
    7.3.2  非線性可分情況
    7.3.3  重溫支持向量機
    7.3.4  支持向量機用於回歸場景
    7.3.5  支持向量機的統計推斷
  7.4  一個分類問題的示例
  7.5  總結與結論
  練習題
  尾註
  本章參考文獻
第8章  神經網絡
  8.1  引言
  8.2  傳統(基礎)神經網絡
    8.2.1  梯度下降的實現
    8.2.2  神經網絡的統計推斷
    8.2.3  一個應用
    8.2.4  一些前沿進展
    8.2.5  傳統神經網絡對實踐的影響
  8.3  神經網絡深度學習
    8.3.1  卷積神經網絡
    8.3.2  循環神經網絡
    8.3.3  對抗神經網絡
  8.4  結論
  示例和練習題
  尾註
  本章參考文獻
第9章  強化學習與遺傳算法
  9.1  強化學習簡介
  9.2  遺傳算法
  9.3  一個應用示例
  9.4  結論
  示例和練習題
  尾註
  本章參考文獻
第10章  主題整合與實用技巧
  10.1  一些綜合性的技術主題
  10.2  整合涉及倫理與政治的主題
  10.3  一些日常實踐的建議
    10.3.1  選擇正確的數據分析程序
    10.3.2  了解你的軟件
    10.3.3  不要忘記基礎
    10.3.4  獲取好的數據
    10.3.5  將目標與實際能力相匹配
  10.4  一些總結性的觀察
  尾註
  本章參考文獻
參考文獻