The Data Warehouse ETL Toolkit : Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data

Ralph Kimball, Joe Caserta

  • 出版商: Wiley
  • 出版日期: 2004-10-01
  • 定價: $1,700
  • 售價: 8.5$1,445
  • 語言: 英文
  • 頁數: 528
  • 裝訂: Paperback
  • ISBN: 8126505540
  • ISBN-13: 9780764567575
  • 相關分類: 大數據 Big-data資料庫Data Science
  • 立即出貨

買這商品的人也買了...

商品描述

Description:

* Cowritten by Ralph Kimball, the world's leading data warehousing authority, whose previous books have sold more than 150,000 copies
* Delivers real-world solutions for the most time- and labor-intensive portion of data warehousing-data staging, or the extract, transform, load (ETL) process
* Delineates best practices for extracting data from scattered sources, removing redundant and inaccurate data, transforming the remaining data into correctly formatted data structures, and then loading the end product into the data warehouse
* Offers proven time-saving ETL techniques, comprehensive guidance on building dimensional structures, and crucial advice on ensuring data quality

 

Table of Contents:

Acknowledgments.

About the Authors.

Introduction.

Part I: Requirements, Realities, and Architecture.

Chapter 1: Surrounding the Requirements.

Chapter 2: ETL Data Structures.

Part II: Data Flow.

Chapter 3: Extracting.

Chapter 4: Cleaning and Conforming.

Chapter 5: Delivering Dimension Tables.

Chapter 6: Delivering Fact Tables.

Part III: Implementation and operations.

Chapter 7: Development.

Chapter 8: Operations.

Chapter 9: Metadata.

Chapter 10: Responsibilities.

Part IV: Real Time Streaming ETL Systems.

Chapter 11: Real-Time ETL Systems.

Chapter 12: Conclusions.

Index.

商品描述(中文翻譯)

描述:



* 由Ralph Kimball共同撰寫,他是全球領先的數據倉儲專家,他的前幾本書已經售出超過15萬冊
* 提供實際解決方案,用於數據倉儲中最耗時和勞動密集的部分-數據分期,或者提取、轉換、加載(ETL)過程
* 界定了從分散源頭提取數據、刪除冗余和不準確數據、將剩餘數據轉換為正確格式的數據結構,然後將最終產品加載到數據倉儲中的最佳實踐
* 提供經過驗證的節省時間的ETL技術,全面指導構建維度結構,以及關鍵的數據質量保證建議



 


目錄:



致謝。


關於作者。


引言。


第一部分:需求、現實和架構。


第1章:需求環境。


第2章:ETL數據結構。


第二部分:數據流。


第3章:提取。


第4章:清理和整理。


第5章:提供維度表。


第6章:提供事實表。


第三部分:實施和運營。


第7章:開發。


第8章:運營。


第9章:元數據。


第10章:責任。


第四部分:實時流式ETL系統。


第11章:實時ETL系統。


第12章:結論。


索引。