Python 全棧數據工程師養成攻略 (視頻講解版) Python全栈数据工程师养成攻略(视频讲解版)

張宏倫

買這商品的人也買了...

商品描述

本書首先介紹了數據工程和Python語法,隨後講解如何獲取和存儲數據,並實現簡單的靜態可視化。文本作為一種極其重要的數據類型,也單獨列出一章進行討論。之後讀者將學習到關於Web建站的一些基礎和進階知識,並基於多種工具完成豐富的動態可視化。這本書選取了機器學習和深度學習兩大熱門領域的核心內容,為讀者進一步實現數據價值的深度分析和挖掘打下堅實基礎。

作者簡介

張宏倫
上海交通大學電子系,研究方向為機器學習、人工智能和自然語言理解,宏倫工作室創始人。
愛好數據,具有金融、交通、氣象、新聞、法律等多個領域的數據分析和項目開發經驗。業餘時間熱衷參加各類數據賽事,曾獲得首屆拍拍貸魔鏡杯數據產品大賽金獎、天池公益雲圖數據可視化大賽銅獎、上海BOT大數據應用大賽二等獎等。
樂於分享,自製的《全棧數據工程師養成攻略》系列視頻教程,在網易云課堂和好大學在線等多家慕課平台上獲得了廣泛肯定和好評。

目錄大綱

第1章寫在前面
1.1數據工程和編程語言
1.1.1如何玩轉數據
1.1.2關於編程語言
1.2帶好裝備—Python和Sublime 
1.2.1Python 
1.2.2Sublime 
1.2.3運行Python代碼的方法
1.2.4Hello World 
1.3數據結構和常見類型
1.3.1數據的結構
1.3.2數據的類型

第2章學會Python 
2.1Python基礎語法
2.1.1Python的特點
2.1.2中文編碼
2.1.3變量
2.1.4註釋
2.1.5保留名
2.1.6行和縮進
2.1.7運算符
2.1.8條件
2.1.9循環
2.1.10時間
2.1.11文件
2.1.12異常
2.1.13函數
2.1.14補充內容
2.2實戰:西遊記用字統計
2.2 .1數據
2.2.2目標
2.2.3步驟
2.2.4總結

第3章獲取數據
3.1HTTP請求和Chrome
3.1.1訪問一個鏈接
3.1.2Chrome瀏覽器
3.1.3HTTP 
3.1.4URL類型
3.2使用Python獲取數據
3.2.1urllib2 
3.2.2GET請求
3.2.3POST請求
3.2.4處理返回結果
3.3實戰:爬取豆瓣電影
3.3.1確定目標
3.3.2通用思路
2.3.3尋找鏈接
3.3.4代碼實現
3.3.5補充內容

第4章存儲數搖
4.1使用XAMP搭建Web環境
4.1.1Web環境:
4.1.2偏好設置
4.1.3HelloWorld 
4.2MySQL使用方法
4.2.1基本概念
4.2.2命令行
4.2.3Web工具
4.2.4本地軟件
4.3使用Python操作數據庫
4.3.1MySQLdb 
4.3.2建立連接
4.3.3執行操作
4.3.4關閉連接
4.3.5擴展內容

第5章靜態可視化
5.1在R中進行可視化
5.1.1下載和安裝
5.1.2R語言基礎
5.1.3ggplot2
5.1.4R語言學習筆記
5.2掌握ggpl00數據可視化
5.2.1圖形種類
5.2.2基本語法
5.2.3條形圖
5.2.4折線圖
5.2.5描述數據分佈
5.2.6分面
5.2.7R語言數據可視化
5.3實戰:Diamonds數據集探索
5.3.1查看數據
5.3.2價格和克拉
5.3.3價格分佈
5.3.4純淨度分佈
5.3.5價格概率分佈
5.3.6不同切工下的價格分佈
5.3.7坐標變換
5.3 .8標題和坐標軸標籤

第6章自然語言理解
6.1走近自然語言理解
6.1.1概念
6.1.2內容
6.1.3應用
6.2使用jieba分詞處理中文
6.2.1jieba中文分詞
6.2.2中文分詞
6.2.3關鍵詞提取
6.2.4詞性標註
6.3詞嵌入的概念和實現
6.3.1語言的表示
6.3.2訓練詞向量
6.3.3代碼實現

第7章Web基礎
7.1網頁的骨骼:HTML 
7.1.1HTML是什麼
7.1. 2基本結構
7.1.3常用標籤
7.1.4標籤的屬性
7.1.5註釋
7.1.6表單
7.1.7顏色
7.1.8DOM 
7.1.9HTML5 
7.1.10補充內容
7.2網頁的血肉:CSS 
7.2.1CSS是什麼
7.2.2基本結構
7.2.3使用css 
7.2.4常用選擇器
7.2.5常用樣式
7.2.6CSS3 
7.2.7CSS實例
7.2.8補充學習
7.3網頁的關節:Js 
7.3.1JS是什麼
7.3.2使用Js 
7.3.3JS基礎
7.3. 4補充學習

第8章Web進階
8.1比JS更方便的JQuery 
8.1.1引入JQuery 
8.1.2語法
8.1.3選擇器
8.1.4事件
8.1.5直接操作
8.1.6AJAX請求
8.1.7補充學習
8.2實戰:你竟是這樣的月餅
8.2.1項目簡介
8.2.2首頁實現
8.2.3月餅頁實現
8.2.4項目總結
8.3基於ThinkPHP的簡易個人博客
8.3.1ThinkPHP是什麼
8.3.2個人博客
8.3.3下載和初始化
8.3.4MVC 
8.3.5數據庫配置
8.3.6控制器、函數和渲染模板
8.3.7u函數和頁面跳轉
8.3.8表單實現和數據處理
8.3.9讀取數據並渲染
8.3.10項目總結
8.4基於Flask的簡易個人博客
8.4.1Flask是什麼
8.4.2項目準備
8.4.3渲染模板
8.4.4操作數據庫
8.4.5完善其他頁面
8.4.6項目總結

第9章動態可視化
9.1使用ECharts製作交互圖形
9.1.1ECharts是什麼
9.1.2引入Echarts 
9.1.3準備一個畫板
9.1.4繪製ECharts圖形
9.1.5使用其他主題
9.1.6配置項手冊
9.1.7開始探索
9.2實戰:再談豆瓣電影數據分析
9.2.1項目成果
9.2.2數據獲取
9.2.3數據清洗和存儲
9.2.4數據分析
9.2.5數據可視化
9.2.6項目總結
9.3數據可視化之魅D3 
9.3. 1D3是什麼
9.3.2D3核心思想
9.3.3一個簡單的例子
9.3.4深入理解D3 
9.3.5開始探索
9.4實戰:星戰電影知識圖譜
9.4.1項目成果
9.4.2數據獲取
9.4.3數據分析
9.4.4數據可視化
9.4.5項目總結
9.5藝術家愛用的Processing 
9.5.1Processing是什麼
9.5.2一個簡單的例子
9.5.3Processing基礎
9.5.4更多內容
9.6實戰:上海地鐵的一天
9.6.1項目成果
9.6.2項目數據
9.6.3項目思路
9.6.4項目實現
9.6.5項目總結

第10章機器學習
10.1明白一些基本概念
10.1.1機器學習是什麼
10.1.2學習的種類
10.1.3兩大痛點
10.1.4學習的流程
10.1.5代碼實現
10.2常用經典模型及實現
10.2.1線性回歸
10.2.2Logistic回歸
10.2.3貝葉斯
10.2.4K近鄰
10.2.5決策樹
10.2.6支持向量機
10.2.7K—Means 
10.2.8神經網絡
10.2.9代碼實現
10.3調參比賽大殺器XGBoost 
10.3.1為什麼要調參
10.3.2XGBoost是什麼
10.3.3XGBoost安裝
10.3.4XGBoost模型參數
10.3.5XGBoost調參實戰
10.3.6總結
10.4實戰:微額借款用戶人品預測
10.4.1項目背景
10.4.2數據概況
10.4.3缺失值處理
10.4.4特徵工程
10.4.5特徵選擇
10.4.6模型設計
10.4.7項目總結

第11章深度學習
11.1初探DeepLearning 
11.1.1深度學習是什麼
11.1.2神經元模型
11.1.3全連接層
11.1.4代碼實現
11.2用於處理圖像的CNN 
11.2.1CNN是什麼
11.2.2CNN棱心內容
11.2.3CNN使用方法
11.2.4CNN模型訓練
11.2.5代碼實現
11.3用於處理序列的RNN 
11.3.1RNN是什麼
11.3.2RNN模型結構
11.3.3LSTM
11.3.4RNN使用方法
11.3.5代碼實現
11.4實戰:多種手寫數字識別模型
11.4.1手寫數字數據集
11.4.2全連接層
11.4.3CNN實現
11.4.4RNN實現
11.4.5實戰總結

第12章數據的故事
12.1如何講一個好的故事
12.1.1為什麼要做PPT 
12.1.2講一個好的故事
12.1.3用顏值加分
12.1.4總結
12.2實戰:有內容有顏值的分享
12.2.1SODA 
12.2. 2公益雲圖
12.2.3上海BOT 
12.2.4總結