SAS數據挖掘與分析項目實戰

尚濤

  • 出版商: 中國鐵道
  • 出版日期: 2020-08-02
  • 定價: $479
  • 售價: 8.5$407
  • 語言: 簡體中文
  • 頁數: 322
  • 裝訂: 平裝
  • ISBN: 7113268501
  • ISBN-13: 9787113268503
  • 相關分類: Data Science
  • 立即出貨

買這商品的人也買了...

商品描述

本書講述了在實際運營中核心的數據挖掘分析案例,為讀者重點展示了SAS在精準營銷、
客戶流失預警、客戶分群、廣告點擊、信用卡欺詐、信用風險評分等領域中的具體應用。
本書分為16章,以數據挖掘基礎知識介紹開始,循序漸進地講述了Kaggle數據科學社區調查數據分析、
考察汽車耗油量與里程數的關係分析、影響汽車銷售的關鍵因子分析、
健身運動中耗氧量回歸分析、旅客量預測分析、客戶群分類判別分析、
銷售公司的客戶分群、員工離職預測、廣告點擊率預測、產品精準營銷模型、
電信客戶流失預警、銀行貸款用戶風險分析、信用風險評分卡的開發以及信用卡反欺詐預測模型等案例。
最後一章介紹了與數據挖掘項目中的時間成本有較大關係的SAS數據清洗的相關技術。
本書案例豐富,實用性較強,特別適合從事數據挖掘、統計建模、機器學習、
商業分析、運營分析等工作的人員使用,也可作為數學、統計學、金融管理、
計算機等專業的學生學習SAS數據挖掘應用的參考書籍。

作者簡介

尚濤

畢業於上海交通大學數學系,擁有數學碩士學位,研究方向為數據挖掘與機器學習應用領域,
曾任職於支付寶、易方達基金等頭部企業,現任職於南方基金,專注於精準營銷、
推薦系​​統、風險評分以及數據化運營等領域的研發工作,
擁有超過10年數據挖掘和優化建模的經驗,以及多年使用SAS、R、Python等軟件的經驗,
在從業經歷中,為所在公司的業務方成功實施了眾多深受好評的數據挖掘項目,取得了較好的業務價值。

目錄大綱

目錄
第1章數據挖掘知識介紹
1.1數據挖掘算法簡介
1.1.1分類
1.1.2聚類
1.1.3關聯
1.1.4預測
1.2分類模型的相關概念
1.2.1數據說明
1.2.2混淆矩陣
1.2.3 ROC曲線和AUC面積
1.2.4提升(Lift)
1.2.5 K—S曲線
1.3數據挖掘過程中關鍵問題處理
1.3.1數據準備
1.3.2定義變量及數據抽樣
1.3.3變量選擇
1.3.4缺失值處理
1.3 .5模型比較
1.4 SAS STXT介紹

第2章Kaggle數據科學社區調查分析
2.1描述性統計分析的主要內容
2.1.1數據的頻數分析
2.1.2數據的集中趨勢分析
2.1.3數據的離散程度分析
2.1. 4數據的分佈
2.1.5繪製統計圖
2.2 SAS描述性分析過程介紹
2.2.1 PROC FREQ過程
2.2.2 PROC MEANS過程
2.2.3 PROC UNIVARIATE過程
2.3調查數據說明
2.4數據探索
2.5 Kaggle社區用戶畫像分析
2.5.1人員屬性
2.5.2工作屬性
2.5. 3技能屬性
2.5.4學習屬性

第3章考察汽車耗油量與里程數的關係
3.1項目背景
3.2非線性回歸簡介
3.3非線性回歸過程說明
3.4廣義線性模型過程
3.5數據文件說明
3.6數據探索
3.7模型建立
3.8結果分析

第4章影響汽車銷售的關鍵因子分析
4.1數據說明
4.2因子分析的基本原理
4.2.1因子分析模型
4.2.2因子旋轉
4.2.3計算因子得分
4.3因子分析的步驟和SAS過程
4.3.1因子分析的步驟
4.3.2 FACTOR過程說明
4.4模型開發及結果解釋

4.5主成分分析和因子分析的區別
第5章健身運動中耗氧量回歸分析
5.1線性回歸模型
5.2 REG過程
5.2.1過程選項
5.2.2 MODEL語句選項
5.2.3關鍵字選項
5.2.4 PLOT語句選項
5.3數據說明

第6章旅客量預測分析
第7章客戶群分類判別分析
第8章銷售公司的客戶分群分析
第9章員工離職預測
第10章廣告點擊率預測
第11章產品精準營銷推薦
第12章通信客戶流失預警模式
第13章銀行貸款用戶風險分析
第14章信用風險評分卡開發
第15章信用卡反欺詐預測模型
第16章SAS數據清洗技術