聯邦學習技術及實戰

彭南博,王虎 等

買這商品的人也買了...

商品描述

本書針對產業界在智能化過程中普遍面臨的數據不足問題,詳細地闡述了聯邦學習如何幫助企業引入更多數據、提升機器學習模型效果。互聯網數據一般分佈在不同的位置,受隱私保護法規限制不能共享,形成了“數據孤島”。聯邦學習像“數據孤島”之間的特殊橋梁,通過傳輸變換後的臨時變量,既能實現模型效果提升,又能確保隱私信息的安全。本書介紹了聯邦學習技術的原理和實戰經驗,主要內容包括隱私保護、機器學習等基礎知識,聯邦求交、聯邦特徵工程算法,三種常見的聯邦形式,以及工程架構、產業案例、數據資產定價等。

作者簡介

彭南博,京東科技集團風險管理中心總監,在人工智能算法、風控模型等領域具有豐富的實踐經驗。
他負責風險智能模型技術佈局和業務落地,建立了數據、算法、工程三位一體的大數據應用體系。
在聯邦學習應用實踐中,他領導團隊研發聯邦學習技術和產品,為風險業務建立了基於聯邦學習的模型工程架構、模型管理體系、模型監控體系。
他於2012年在中國科學院大學獲得博士學位,先後參與三項國家基金項目,發表期刊和會議論文10餘篇,申請專利70餘項。


王虎,京東科技集團風險管理中心算法科學家,在機器學習和數據挖掘領域具有豐富的產業應用經驗。
他負責風險場景的模型研發,針對風險數據孤島問題,調研並論證聯邦學習技術的可行性,完成了從0到1的聯邦風控應用創新,負責聯邦組網過程中的算法研發和模型優化。
他於2012年在中國科學院大學獲得博士學位,其後負責並完成了藥物副作用挖掘、電力銷量預測、駕駛員狀態分析、基於穿戴式醫療設備的健康評估等機器學習項目。

目錄大綱

第1章/ 聯邦學習的研究與發展現狀
1.1 聯邦學習的背景
1.2 大數據時代的挑戰:數據孤島
1.2.1 “數據孤島”的成因
1.2.2 具體實例
1.2.3 數據互聯的發展與困境
1.2.4 解決“數據孤島”問題的難點與聯邦學習的優勢
1.3 聯邦學習的定義和基本術語
1.3.1 聯邦學習的定義
1.3.2 聯邦學習的基本術語
1.4 聯邦學習的分類及適用範圍
1.4.1 縱向聯邦學習
1.4.2 橫向聯邦學習
1.4.3 聯邦遷移學習
1.5 典型的聯邦學習生命週期
1.5.1 模型訓練
1.5.2 在線推理
1.6 聯邦學習的安全性與可靠性
1.6.1 安全多方計算
1.6.2 差分隱私
1.6.3 同態加密
1.6.4 應對攻擊的健壯性

第2章/ 多方計算與隱私保護
2.1 多方計算
2.2 基本假設與隱私保護技術
2.2.1 安全模型
2.2.2 隱私保護的目標
2.2.3 三種隱私保護技術及其關係
2.3 差分隱私
2.3.1 差分隱私的基本概念
2.3.2 差分隱私的性質
2.3.3 差分隱私在聯邦學習中的應用
2.4 同態加密
2.4.1 密碼學簡介
2.4.2 同態加密算法的優勢
2.4.3 半同態加密算法
2.4.4 全同態加密算法
2.4.5 半同態加密算法在聯邦學習中的應用
2.5 安全多方計算
2.5.1 百萬富翁問題
2.5.2 安全多方計算中的密碼協議
2.5.3 安全多方計算在聯邦學習中的應用

第3章/ 傳統機器學習
3.1 統計機器學習的簡介
3.1.1 統計機器學習的概念
3.1.2 數據結構與術語
3.1.3 機器學習算法示例
3.2 分佈式機器學習的簡介
3.2.1 分佈式機器學習的背景
3.2.2 分佈式機器學習的並行模式
3.2.3 分佈式機器學習對比聯邦學習
3.3 特徵工程
3.3.1 錯誤及缺失處理
3.3.2 數據類型
3.3.3 特徵工程方法
3.4 最優化算法
3.4.1 最優化問題
3.4.2 解析方法
3.4.3 一階優化算法
3.4.4 二階優化算法
3.5 模型效果評估
3.5.1 效果評估方法
3.5.2 效果評估指標

第4章/ 聯邦交集計算
4.1 聯邦交集計算介紹
4.1.1 基於公鑰加密體制的方法
4.1.2 基於混亂電路的方法
4.1.3 基於不經意傳輸協議的方法
4.1.4 其他方法
4.2 聯邦交集計算在聯邦學習中的應用
4.2.1 實體解析與縱向聯邦學習
4.2.2 非對稱縱向聯邦學習
4.2.3 聯邦特徵匹配

第5章/ 聯邦特徵工程
5.1 聯邦特徵工程概述
5.1.1 聯邦特徵工程的特點
5.1.2 傳統特徵工程和聯邦特徵工程的對比
5.2 聯邦特徵優化
5.2.1 聯邦特徵評估
5.2.2 聯邦特徵處理
5.2.3 聯邦特徵降維
5.2.4 聯邦特徵組合
5.2.5 聯邦特徵嵌入
5.3 聯邦單變量分析
5.3.1 聯邦單變量基礎分析
5.3.2 聯邦WOE和IV計算
5.3.3 聯邦PSI和CSI計算
5.3.4 聯邦KS和LIFT計算
5.4 聯邦自動特徵工程
5.4.1 聯邦超參數優化
5.4.2 聯邦超頻優化
5.4.3 聯邦神經結構搜索

第6章/ 縱向聯邦學習
6.1 基本假設及定義
6.2 縱向聯邦學習的架構
6.3 聯邦邏輯回歸
6.4 聯邦隨機森林
6.5 聯邦梯度提升樹
6.5.1 XGBoost簡介
6.5.2 SecureBoost簡介
6.5.3 SecureBoost訓練
6.5.4 SecureBoost推理
6.6 聯邦學習深度神經網絡
6.7 縱向聯邦學習案例

第7章/ 橫向聯邦學習
7.1 基本假設與定義
7.2 橫向聯邦網絡架構
7.2.1 中心化架構
7.2.2 去中心化架構
7.3 聯邦平均算法概述
7.3.1 在橫向聯邦學習中優化問題的一些特點
7.3.2 聯邦平均算法
7.3.3 安全的聯邦平均算法
7.4 橫向聯邦學習應用於輸入法

第8章/ 聯邦遷移學習
8.1 基本假設與定義
8.1.1 遷移學習的現狀
8.1.2 圖像中級特徵的遷移
8.1.3 從文本分類到圖像分類的遷移
8.1.4 聯邦遷移學習的提出
8.2 聯邦遷移學習架構
8.3 聯邦遷移學習方法
8.3.1 多項式近似
8.3.2 加法同態加密
8.3.3 ABY
8.3.4 SPDZ
8.3.5 基於加法同態加密進行安全訓練和預測
8.3.6 基於ABY和SPDZ進行安全訓練
8.3.7 性能分析
8.4 聯邦遷移學習案例
8.4.1 應用場景
8.4.2 聯邦遷移強化學習
8.4.3 遷移學習的補充閱讀材料

第9章/ 聯邦學習架構揭秘與優化實戰
9.1 常見的分佈式機器學習架構介紹
9.2 聯邦學習開源框架介紹
9.2.1 TensorFlow Federated
9.2.2 FATE框架
9.2.3 其他開源框架
9.3 訓練服務架構揭秘
9.4 推理架構揭秘
9.5 調優案例分析
9.5.1 特徵工程調優
9.5.2 訓練過程的通信過程調優
9.5.3 加密的密鑰長度
9.5.4 隱私數據集求交集過程優化
9.5.5 服務器資源優化
9.5.6 推理服務優化

第10章/ 聯邦學習的產業案例
10.1 醫療健康
10.1.1 患者死亡可能性預測
10.1.2 醫療保健
10.1.3 聯邦學習在醫療領域中的其他應用
10.2 金融產品的廣告投放
10.3 金融風控
10.3.1 數據方之間的聯邦學習
10.3.2 數據方與金融機構之間的聯邦學習
10.4 其他應用
10.4.1 聯邦學習應用於推薦領域
10.4.2 聯邦學習與無人機
10.4.3 聯邦學習與新型冠狀病毒肺炎監測

第11章/ 數據資產定價與激勵機制
11.1 數據資產的相關概念及特點
11.1.1 大數據時代背景
11.1.2 數據資產的定義
11.1.3 數據資產的特點
11.1.4 數據市場
11.2 數據資產價值的評估與定價
11.2.1 數據資產價值的主要影響因素
11.2.2 數據資產價值的評估方案
11.2.3 數據資產的定價方案
11.3 激勵機制
11.3.1 貢獻度量化方案
11.3.2 收益分配方案
11.3.3 數據資產定價與激勵機制的關係

第12章/ 聯邦學習面臨的挑戰和可擴展性
12.1 聯邦學習面臨的挑戰
12.1.1 通信與數據壓縮
12.1.2 保護用戶隱私數據
12.1.3 聯邦學習優化
12.1.4 模型的魯棒性
12.1.5 聯邦學習的公平性
12.2 聯邦學習與區塊鏈結合
12.2.1 王牌技術
12.2.2 可信媒介
12.2.3 對比異同
12.2.4 強強聯合
12.3 聯邦學習與其他技術結合