智能推薦算法與系統構建實踐

陳實如

  • 出版商: 人民郵電
  • 出版日期: 2024-01-01
  • 售價: $779
  • 貴賓價: 9.5$740
  • 語言: 簡體中文
  • 頁數: 441
  • ISBN: 7115614873
  • ISBN-13: 9787115614872
  • 立即出貨 (庫存 < 3)

  • 智能推薦算法與系統構建實踐-preview-1
  • 智能推薦算法與系統構建實踐-preview-2
智能推薦算法與系統構建實踐-preview-1

商品描述

本書從系統視角出發,闡述如何利用技術手段搭建企業級推薦系統,內容包括認知篇、數據篇、召回篇、排序篇、系統篇 5 個部分,覆蓋企業級推薦系統建設的核心要點。本書知識體系清晰,從基礎知識切入,逐步深入,先後涉及推薦系統的經典技術、主流技術和前沿技術。本書通過“理論+案例+代碼示例+心得體會”的方式闡述、歸納和總結推薦系統的知識,幫助讀者理解推薦系統,掌握技能,建立系統思維。

本書適合對推薦系統感興趣的初學者、從事數據挖掘/信息推薦相關工作的研發工程師、產品經理、架構師,以及相關專業學生和教師閱讀。

作者簡介

陈实如

博士研究生,教授级高级工程师,浪潮集团资深研究员,长期从事企业数字化转型、技术规划和技术管理,专注于物联网、大数据、工业互联网人工智能等领域,擅长数据挖掘、数据建模、推荐算法和系统架构构建。独立负责几十个信息化平台的研发和交付,具有丰富的开发实战经验。喜欢总结,乐于分享。在国外核心期刊发表论文30余篇,获得国家发明专利授权20余项。

目錄大綱

第 1 部 分 認 知 篇 1

第 1 章 認識推薦系統 3

1.1 推薦與推薦系統 3

1.2 生活中的推薦系統 6

1.3 推薦系統的特點與價值 9

1.4 推薦服務 12

1.5 個性化推薦策略 14

1.5.1 U2Tag2I 策略 14

1.5.2 U2U2I 策略 15

1.5.3 U2I2I 策略 15

1.5.4 U2I 策略 16

1.6 本章小結 16

第 2章 推薦系統技術實現 17

2.1 工作原理 17

2.2 業務流程 18

2.3 業務功能模塊 21

2.3.1 數據採集 22

2.3.2 特徵工程 26

2.3.3 推薦算法 29

2.3.4 推薦服務 36

2.3.5 效能評價 38

2.4 推薦系統開發 39

2.5 本章小結 43

第 2 部 分 數 據 篇 45

第 3 章 數據提取與特徵向量 47

3.1 特徵標簽構建流程 47

3.2 特徵標簽構建方法 49

3.3 數據提取 51

3.4 數據處理 53

3.4.1 數據統計 54

3.4.2 數據標準化 55

3.4.3 數據離散化 58

3.5 特徵編碼 61

3.5.1 類別數據 61

3.5.2 時間數據 69

3.5.3 位置數據 73

3.5.4 文本數據 74

3.6 本章小結 86

第 4 章 構建個性化特徵標簽 87

4.1 喜歡度——衡量用戶感興趣的程度 87

4.2 新聞特徵標簽 89

4.2.1 基本特徵 89

4.2.2 類別特徵 90

4.2.3 內容特徵 91

4.2.4 趨勢特徵 100

4.2.5 新聞特徵向量 102

4.3 用戶特徵標簽 103

4.3.1 基本特徵 104

4.3.2 位置特徵 104

4.3.3 興趣偏好特徵 105

4.3.4 行為特徵 109

4.3.5 價值特徵 109

4.3.6 用戶特徵向量 111

4.4 特徵相似度計算 112

4.4.1 歐幾里得距離 113

4.4.2 曼哈頓距離 113

4.4.3 閔可夫斯基距離 113

4.4.4 馬氏距離 114

4.4.5 餘弦相似度 114

4.4.6 皮爾遜相關系數 115

4.4.7 傑卡德相關系數 116

4.4.8 代碼示例 117

4.5 本章小結 121

第5章 交叉組合構建新特徵 122

5.1 特徵組合 122

5.1.1 特徵拼接 122

5.1.2 笛卡兒構建 123

5.1.3 線性組合 123

5.1.4 多項式特徵 124

5.1.5 代碼示例 125

5.2 特徵選擇 128

5.2.1 方差選擇 129

5.2.2 相關選擇 129

5.2.3 卡方檢驗 131

5.2.4 主成分分析 133

5.2.5 樹模型選擇 136

5.2.6 代碼示例 143

5.3 本章小結 150

第 3 部 分 召 回 篇 151

第 6 章 機器學習模型 153

6.1 機器學習的定義 153

6.1.1 有監督學習 154

6.1.2 無監督學習 154

6.2 數據集 155

6.2.1 常用公開數據集 156

6.2.2 在線構建數據集 156

6.2.3 數據集劃分 160

6.2.4 生成訓練集 166

6.3 模型訓練 168

6.4 模型保存 169

6.5 模型評價 170

6.5.1 分類模型評價 170

6.5.2 回歸模型評價 173

6.5.3 代碼示例 174

6.6 模型上線 175

6.7 本章小結 176

第 7 章 基於新聞熱度的推薦召回 177

7.1 新聞熱度 177

7.2 熱門推薦算法 179

7.3 代碼示例 179

7.4 本章小結 184

第 8 章 基於內容的推薦召回 185

8.1 商品內容 185

8.2 KNN 算法模型 186

8.2.1 KNN 發現 186

8.2.2 KNN 算法改進 187

8.3 代碼示例 189

8.4 本章小結 199

第 9 章 基於標簽的推薦召回 201

9.1 認識標簽 201

9.2 標簽推薦算法 202

9.3 升級標簽推薦算法 206

9.4 代碼示例 207

9.5 本章小結 211

第 10章 協同過濾推薦召回 212

10.1 UserCF 算法 212

10.1.1 算法原理 212

10.1.2 代碼示例 218

10.2 ItemCF 算法 223

10.2.1 算法原理 223

10.2.2 代碼示例 227

10.3 本章小結 232

第 11章 基於矩陣分解的推薦召回 233

11.1 數學知識 233

11.2 SVD 推薦算法 236

11.3 代碼示例 237

11.4 本章小結 241

第 12章 基 於LFM 的推薦召回 243

12.1 LFM 概述 243

12.2 LFM 推薦算法 244

12.3 代碼示例 247

12.4 本章小結 251

第 13章 多路召回融合策略 252

13.1 多路召回策略 252

13.2 融合策略 254

13.2.1 順序融合 255

13.2.2 平均加權融合 256

13.2.3 加權融合 256

13.2.4 動態加權融合 257

13.3 代碼示例 257

13.4 本章小結 266

第 4 部 分 排 序 篇 267

第 14章 線性模型排序算法 269

14.1 回歸模型 269

14.2 線性回歸模型 270

14.3 邏輯回歸模型 273

14.3.1 算法模型 273

14.3.2 模型參數估計 275

14.3.3 代碼示例 277

14.4 本章小結 283

第 15章 LR-GBDT 模型排序算法 284

15.1 CART 決策樹 284

15.2 集成學習模型 292

15.2.1 Bagging 算法 293

15.2.2 Boosting 算法 294

15.2.3 Stacking 算法 295

15.3 GBDT 模型 296

15.4 LR-GBDT 模型 299

15.4.1 模型算法推導 299

15.4.2 代碼示例 300

15.5 本章小結 306

第 16章 深度學習模型排序算法 307

16.1 神經元 307

16.2 ANN 模型 309

16.3 模型訓練 315

16.3.1 正向傳遞 317

16.3.2 反向傳遞 319

16.4 模型優化 323

16.4.1 梯度優化算法 324

16.4.2 Batch 歸一化 327

16.4.3 正則化 328

16.5 DNN 模型 329

16.5.1 模型構建 329

16.5.2 代碼示例 331

16.6 Wide&Deep 模 型 335

16.6.1 Wide 部分 336

16.6.2 Deep 部分 337

16.6.3 聯合訓練 337

16.6.4 Wide&Deep 模型案例 338

16.7 本章小結 339

第 5 部 分 系 統 篇 341

第 17章 推薦服務生成與管理 343

17.1 推薦系統的 Web服務 343

17.2 推薦服務的請求與響應 345

17.2.1 HTTP 346

17.2.2 REST 編程風格 349

17.2.3 基於Django 開發REST 風格API 352

17.2.4 基於 Spring MVC 開發 REST 風格 API 354

17.3 生成推薦結果 355

17.3.1 離線生成 356

17.3.2 在線生成 360

17.3.3 在線+離線融合生成 361

17.3.4 代碼示例 364

17.4 生成方案對比 376

17.5 本章小結 377

第 18章 推薦系統效能評價 379

18.1 推薦系統評價 379

18.2 用戶調研 380

18.3 離線測試 382

18.3.1 離線測試方法 382

18.3.2 離線測試指標 384

18.4 在線測試 384

18.4.1 A B 測 試 385

18.4.2 推薦系統的 AB 測試實驗 389

18.4.3 在線測試指標 392

18.5 本章小結 398

第 19章 推薦系統架構設計 400

19.1 系統架構概述 400

19.2 系統邊界 405

19.3 系統總體架構 407

19.4 依賴的第三方環境 413

19.4.1 大數據計算平臺 413

19.4.2 機器學習平臺 417

19.4.3 存儲平臺 420

19.4.4 數據查詢檢索平臺 421

19.4.5 Web 系統開發框架 421

19.5 系統技術架構 422

19.5.1 數據流 424

19.5.2 離線層計算 426

19.5.3 近線層計算 427

19.5.4 在線層計算 429

19.5.5 技術架構對比 432

19.6 系統部署架構 434

19.7 系統建設步驟 438

19.8 本章小結 439