數據清洗
黑馬程序員
買這商品的人也買了...
-
$580$452 -
$480$408 -
$250Maven 應用實戰
-
$480$379 -
$420$328 -
$294$279 -
$352Apache Kafka 2.0 入門與實踐
-
$454數據中台:讓數據用起來
-
$420$357 -
$505$475 -
$454超大流量分佈式系統架構解決方案:人人都是架構師2.0
-
$474$450 -
$352數據倉庫, 4/e (Building the Data Warehouse, 4/e)
-
$1,000$780 -
$414$393 -
$505編程的邏輯:如何用面向對象方法實現復雜業務需求
-
$474$450 -
$299$284 -
$505標簽類目體系:面向業務的數據資產設計方法論
-
$551快速上手 Scala:Spark 大數據分析入門
-
$1,367ASP.NET Core 3 高級編程, 8/e
-
$239數據清洗 (微課視頻版)
-
$458Python 數據科學實戰 (Data Science with Python)
-
$599$509 -
$454大數據分析師面試筆試寶典
相關主題
商品描述
數據清洗是大數據預處理的關鍵環節。面對錯綜復雜的數據,傳統的清洗“臟”數據工作單調且異常辛苦,如果能利用正確的工具和方法,可以讓數據清洗工作變得事半功倍。本書講解數據清洗的理論知識和實際應用,全書共8章: 第1章主要帶領大家簡單認識數據清洗;第2章主要講解ETL技術相關的知識;第3章講解Kettle工具的基本使用;第4章主要講解數據清洗的第一步——數據抽取;第5章主要講解數據清洗與檢驗;第6章主要講解數據轉換相關的知識;第7章主要講解數據加載相關的知識;第8章利用前面章節所學的知識構建一個DVD租賃商店數據倉庫,目的是實現定期從源數據庫sakila中抽取增量數據,轉換成符合DVD租賃業務的數據,最後加載到DVD租賃商店數據倉庫中,便於後續在線DVD租賃商店的決策者對數據進行分析得出商業決策。本書附有配套視頻、源代碼、習題、教學設計、教學課件等資源。同時,為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關註。 本書可作為高等院校本專科電腦、信息管理等相關專業的大數據課程教材,也可供相關技術人員參考,是一本適合廣大電腦編程愛好者的優秀讀物。