Pentaho Kettle 解決方案-使用 PDI 構建開源 ETL 解決方案(Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Integration) Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案
卡斯特 (Matt Casters), 布曼 (Roland Bouman), 東恩 (Jos van Dongen)
- 出版商: 電子工業
- 出版日期: 2014-03-01
- 定價: $534
- 售價: 8.5 折 $454
- 語言: 簡體中文
- 頁數: 460
- 裝訂: 平裝
- ISBN: 7121224453
- ISBN-13: 9787121224454
已絕版
買這商品的人也買了...
-
$403SAP ABAP 開發技術詳解-實例篇
-
$420$357 -
$520$406 -
$380$296 -
$505深入淺出 MySQL:數據庫開發、優化與管理維護, 2/e
-
$620$527 -
$254Liferay Portal 6.1 門戶網站建設最佳實踐
-
$454Python 自然語言處理 (Natural Language Processing with Python)
-
$403商業智能深入淺出——大數據時代下的架構規劃與案例(第2版)
-
$400$316 -
$880$695 -
$680$510 -
$602Oracle 數據庫管理員日常操作手冊
-
$280$218 -
$780$616 -
$690$538 -
$250大數據智能—因特網時代的機器學習和自然語言處理技術
-
$254MongoDB大數據處理權威指南(第3版)
-
$294$279 -
$590$460 -
$520$468 -
$500$250 -
$450$356 -
$500$390 -
$880$695
相關主題
商品描述
<內容簡介>
《Pentaho Kettle解決方案--使用PDI構建開源ETL解決方案》(作者卡斯特、布曼、東恩)主要介紹如何使用開源ETL工具來完成數據整合工作。
《Pentaho Kettle解決方案--使用PDI構建開源ETL解決方案》介紹的PDI(Kettle)是一種開源的 ETL 解決方案,書中介紹瞭如何使用PDI來實現數據的剖析、清洗、校驗、抽取、轉換、加載等各類常見的ETL類工作。
除了ODS/DW類比較大型的應用外,Kettle實際還可以為中小企業提供靈活的數據抽取和數據處理的功能。Kettle除了支持各種關係型數據庫、HBase、MongoDB這樣的NoSQL數據源外,它還支持Excel、Access這類小型的數據源。並且通過插件擴展,Kettle可以支持各類數據源。本書詳細介紹了Kettle可以處理的數據源,而且詳細介紹瞭如何使用Kettle抽取增量數據。
Kettle的數據處理功能也很強大,除了選擇、過濾、分組、連接、排序這些常用的功能外,Kettle里的Java表達式、正則表達式、Java腳本、Java類等功能都非常靈活而強大,都非常適合於各種數據處理功能。本書也使用了一些篇幅介紹Kettle這些靈活的數據處理功能。
《Pentaho Kettle解決方案:使用PDI構建開源ETL解決方案》後面章節介紹瞭如何在 Kettle上開發插件,如何使用Kettle處理實時數據流,以及如何在Amazon AWS上運行Kettle等一些高級主題。
除了介紹PDI(Kettle)工具的使用和功能,本書還結合Kimball博士的數據倉庫和ETL子系統的理論,從實踐的角度介紹數據倉庫的模型設計、數據倉庫的構建方法,以及如何使用PDI實現Kimball博士提出的34種ETL子系統。