Python 廣告數據挖掘與分析實戰

楊游雲 周健 著

  • 出版商: 機械工業
  • 出版日期: 2021-03-01
  • 定價: $534
  • 售價: 8.5$454
  • 語言: 簡體中文
  • 頁數: 224
  • 裝訂: 平裝
  • ISBN: 7111677625
  • ISBN-13: 9787111677628
  • 相關分類: Python程式語言Data Science
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

商品描述

這是一部營銷和廣告數據挖掘與分析的實戰指南,橫跨技術和業務兩個維度,理論與實踐相結合。技術維度,結合營銷與廣告行業的實際需求,系統講解了廣告數據挖掘的模型、算法以及數據分析方法,從而實現面向用戶的精準營銷;業務維度,結合廣告業務的具體場景,為廣告中的具體問題提供解決方案。更重要的是,本書還講解了熱門的機器學習算法在廣告數據挖掘與分析中的應用。
全書共 10 章,從邏輯上可分為技術理論知識和具體業務應用兩個部分。前6章以及第10章主要講解了廣告數據分析與挖掘的技術、方法和應用,第7~9 章則主要講解了廣告業務中的具體問題及相應的解決方法。
第1~2 章主要介紹了Python的安裝和環境配置,以及廣告數據和廣告數據分析的基礎知識;
第3~6章深入講解了Python常用的工具包、模型常用的評價指標,以及如何利用Python建立廣告分類模型和集成模型。
第7~8章講解了廣告數據分析的典型案例和常用分析方法,以及如何做一份滿意的數據分析報告。
第9章講解瞭如何運用數據分析與挖掘方法解決廣告業務中的實際問題。
第 10 章主要講解了常用的數據預處理及特徵選擇方法。

作者簡介

楊遊雲
資深數據分析專家和AI技術專家,在廣告領域工作多年,目前就職於微思敦深圳分公司皓量科技。
在AI技術領域有非常深厚的積累,擅長機器學習和自然語言處理,對圖像識別技術也有一定的研究。
個人微信公眾號:數據挖掘與AI算法。


周健
資深數據挖掘工程師,現就職於國內某大型徵信服務公司,曾為多家國有銀行、股份制銀行、大型金融機構提供反欺詐、信用評分方案。
在傳統機器學習方面有深入的理解和豐富的實戰經驗,在網絡爬蟲和自然語言處理方面也有自己獨特的見解。

目錄大綱

前言
第1章 Python安裝方法1
1.1 Python介紹1
1.1.1 Python的由來1
1.1.2 Python的特點2
1.2 Anaconda安裝2
1.3 PyCharm安裝及環境配置9
1.3.1 PyCharm安裝9
1.3.2 PyCharm環境配置12
1.4 為什麽建議使用Python17
1.5 本章小結18


第2章 認識廣告數據分析19
2.1 廣告數據概述19
2.1.1 廣告數據的特點19
2.1.2 廣告數據分析的意義20
2.2 廣告數據分佈20
2.2.1 伯努利分佈20
2.2.2 均勻分佈20
2.2.3 二項分佈21
2.2.4 正態分佈22
2.2.5 泊松分佈22
2.2.6 指數分佈23
2.3 異常值診斷24
2.3.1 三倍標準差法24
2.3.2 箱形圖分析法25
2.4 數據相關性26
2.4.1 Pearson相關系數26
2.4.2 Spearman秩相關系數26
2.5 顯著性檢驗27
2.6 本章小結27


第3章 Python廣告數據分析常用工具包29
3.1 數據基礎運算工具:NumPy29
3.1.1 常見數據結構30
3.1.2 索引與切片34
3.1.3 數組運算35
3.1.4 矩陣運算39
3.1.5 廣播42
3.1.6 其他常用操作43
3.2 數據預處理工具:Pandas46
3.2.1 數據結構概述47
3.2.2 數據加載49
3.2.3 數據拼接53
3.2.4 數據聚合57
3.2.5 數據透視表和交叉表59
3.2.6 廣告缺失值處理60
3.3 數據可視化分析工具:Matplotlib63
3.3.1 散點圖64
3.3.2 條形圖65
3.3.3 折線圖66
3.3.4 餅圖68
3.3.5 直方圖68
3.3.6 箱形圖71
3.3.7 組合圖72
3.4 本章小結74


第4章 模型常用評價指標75
4.1 回歸模型常用評價指標75
4.1.1 R275
4.1.2 調整後的R276
4.2 分類模型常用評價指標77
4.2.1 混淆矩陣77
4.2.2 ROC曲線79
4.2.3 AUC80
4.2.4 KS指標82
4.2.5 提升度85
4.3 本章小結87


第5章 利用Python建立廣告分類模型88
5.1 邏輯回歸88
5.1.1 邏輯回歸原理88
5.1.2 損失函數89
5.1.3 利用Python建立邏輯回歸92
5.2 決策樹92
5.2.1 決策樹概述92
5.2.2 決策樹算法93
5.2.3 決策樹剪枝處理96
5.2.4 決策樹的實現97
5.3 KNN98
5.3.1 距離度量98
5.3.2 KNN算法原理99
5.3.3 KNN算法中K值的選取100
5.3.4 KNN中的一些註意事項100
5.3.5 KNN分類算法實現101
5.4 SVM101
5.4.1 最大間隔超平面101
5.4.2 支持向量103
5.4.3 目標函數104
5.4.4 軟間隔最大化106
5.4.5 核函數107
5.4.6 SVM算法的應用109
5.5 神經網絡110
5.5.1 結構特點110
5.5.2 訓練過程111
5.5.3 激活函數114
5.5.4 損失函數117
5.5.5 神經網絡的實現118
5.6 本章小結118


第6章 利用Python建立廣告集成模型119
6.1 隨機森林119
6.1.1 隨機森林的Bagging思想119
6.1.2 隨機森林的生成及優點120
6.1.3 袋外誤差121
6.1.4 Scikit-learn隨機森林類庫介紹122
6.1.5 隨機森林模型的實現123
6.2 GBDT124
6.2.1 GBDT算法思想124
6.2.2 GBDT算法原理125
6.2.3 Scikit-learn GBDT類庫介紹126
6.2.4 使用Scikit-learn類庫實現GBDT算法127
6.3 XGBoost128
6.3.1 XGBoost算法思想128
6.3.2 XGBoost算法原理129
6.3.3 XGBoost算法的優點130
6.3.4 XGBoost類庫參數131
6.3.5 使用Scikit-learn類庫實現XGBoost算法132
6.4 Stacking133
6.4.1 Stacking算法思想134
6.4.2 Stacking算法原理135
6.4.3 Stacking算法實現136
6.5 LR+GBDT137
6.5.1 LR+GBDT原理138
6.5.2 LR+GBDT在廣告CTR中的應用139
6.5.3 LR+GBDT算法實現140
6.6 FM142
6.6.1 FM的原理142
6.6.2 FM的改進145
6.6.3 FM的Python實現145
6.7 本章小結147


第7章 移動廣告常用數據分析方法149
7.1 App下載數據分析149
7.2 游戲行業用戶分析151
7.2.1 游戲行業數據分析的作用152
7.2.2 游戲行業的關鍵數據指標152
7.2.3 游戲用戶數據分析方法154
7.3 電商類App用戶轉化分析156
7.4 工具類App用戶分析162
7.5 本地O2O婚紗攝影行業分析163
7.5.1 精準人群定向164
7.5.2 廣告創意素材164
7.6 品牌廣告與效果廣告166
7.7 本章小結168


第8章 廣告數據分析報告169
8.1 分析觀點明確,邏輯清晰169
8.2 匯報結果,用數據說話170
8.3 分析過程有理有據171
8.4 圖表說明171
8.5 數據驗證173
8.6 分析建議173
8.7 本章小結174


第9章 廣告用戶數據挖掘與分析175
9.1 廣告用戶曝光與響應率分析175
9.2 廣告用戶曝光與點擊率分析178
9.3 廣告訂單消耗與延時性分析181
9.3.1 Budget Smooth算法184
9.3.2 Budget Smooth的系統設計184
9.4 Lookalike聚類分析186
9.4.1 Lookalike概述186
9.4.2 K-means聚類187
9.4.3 K-means算法的過程188
9.4.4 K-means算法的實現188
9.5 Lookalike技術在廣告中的應用190
9.5.1 Lookalike的基本流程190
9.5.2 微信社交中的Lookalike應用191
9.6 本章小結192


第10章 廣告數據預處理與特徵選擇193
10.1 廣告數據預處理193
10.1.1 特徵縮放193
10.1.2 特徵編碼195
10.2 常用特徵選擇方法197
10.2.1 Filter198
10.2.2 Wrapper203
10.2.3 Embedded207
10.3 PCA209
10.3.1 PCA的主要思想209
10.3.2 最大方差理論210
10.4 本章小結214