數據科學與商業分析 用機器學習與統計學優化商業決策 Business Data Science: Combining Machine Learning and Economics to Optimize, Automate, and Accelerate Business Decisions

[美] 馬特·塔迪(Matt Taddy)

  • 數據科學與商業分析 用機器學習與統計學優化商業決策-preview-1
  • 數據科學與商業分析 用機器學習與統計學優化商業決策-preview-2
數據科學與商業分析 用機器學習與統計學優化商業決策-preview-1

買這商品的人也買了...

商品描述

大數據和機器學習等的興起使得商業分析領域越來越倚重數據科學。本書詳細介紹了商業數據科學中的關鍵元素,匯集了機器學習、經濟學以及統計學領域的核心原則和最佳實踐,內容涵蓋識別商業政策中的重要變量、通過實驗測量這些變量,以及挖掘社交媒體以瞭解公眾對於政策修改的反應,為從事商業數據科學的數據科學家和商業人士提供了必備工具。書中通過大量數據分析示例講解如何利用R語言編寫腳本來解決復雜的數據科學問題。

作者簡介

Matt Taddy,美國經濟學家、數據科學家。
現任亞馬遜北美首席經濟學家、大名鼎鼎的亞馬遜經濟學家團隊Central Economics Team VP。
曾任芝加哥大學布斯商學院計量經濟學和統計學教授,明星教師,開創了數據科學課程。
曾任微軟商務人工智能首席研究員、eBay研究員。

目錄大綱

對本書的讚譽
獻詞
前言
常見符號的標準用法
第0章引言1
從兩張圖說起1
大數據與機器學習4
計算6

第1章不確定性14
1.1頻率不確定性和bootstrap方法14
1 .2假設檢驗和錯誤發現率控制25
1.3貝葉斯推斷33

第2章回歸37
2.1線性模型37
2.2邏輯回歸46
2.3偏差與似然49
2.4 ◆回歸不確定性53
2.5空間和時間56

第3章正則化64
3.1樣本外預測效果64
3.2正則化方法68
3.3模型選擇77
3.4 ◆lasso的不確定性量化87

第4章分類94
4.1最近鄰94
4.2概率、成本和分類97
4.3多元邏輯回歸102
4.4分佈式多元回歸106
4.5分佈式與大數據110

第5章實驗114
5.1隨機控制試驗115
5.2近似實驗設計125
5.3 ◆工具變量135

第6章控制143
6.1條件可忽略性與線性處理效果143
6.2高維混淆變量調整146
6.3 ◆樣本分割與正交機器學習148
6.4異質性處理效果152
6.5合成控制法164

第7章分解167
7.1聚類167
7.2因子模型和主成分分析173
7.3主成分回歸180
7.4偏最小二乘法184

第8章文本作為數據189
8.1分詞190
8.2文本回歸194
8.3主題模型194
8.4多元逆回歸200
8.5協同過濾204
8.6詞嵌入技術206

第9章非參數方法209
9.1決策樹210
9.2隨機森林216
9.3因果關係樹224
9.4半參數方法與高斯過程228

第10章人工智能233
10.1什麼是人工智能233
10.2通用機器學習237
10.3深度學習240
10.4 ◆SGD 244
10.5強化學習248
10.6商業環境中的人工智能251