Apache Hive Essentials: Essential techniques to help you process, and get unique insights from, big data, 2nd Edition
暫譯: Apache Hive 基礎精要:幫助您處理大數據並獲取獨特見解的基本技術(第二版)
Dayong Du
- 出版商: Packt Publishing
- 出版日期: 2018-06-29
- 定價: $1,050
- 售價: 8.0 折 $840
- 語言: 英文
- 頁數: 210
- 裝訂: Paperback
- ISBN: 1788995090
- ISBN-13: 9781788995092
-
相關分類:
Hadoop、大數據 Big-data
立即出貨 (庫存=1)
買這商品的人也買了...
-
$680$537 -
$680$537 -
$780$616 -
$480$374 -
$480$408 -
$1,260$983 -
$520$260 -
$550$495
相關主題
商品描述
This book takes you on a fantastic journey to discover the attributes of big data using Apache Hive.
Key Features
- Grasp the skills needed to write efficient Hive queries to analyze the Big Data
- Discover how Hive can coexist and work with other tools within the Hadoop ecosystem
- Uses practical, example-oriented scenarios to cover all the newly released features of Apache Hive 2.3.3
Book Description
In this book, we prepare you for your journey into big data by frstly introducing you to backgrounds in the big data domain, alongwith the process of setting up and getting familiar with your Hive working environment.
Next, the book guides you through discovering and transforming the values of big data with the help of examples. It also hones your skills in using the Hive language in an effcient manner. Toward the end, the book focuses on advanced topics, such as performance, security, and extensions in Hive, which will guide you on exciting adventures on this worthwhile big data journey.
By the end of the book, you will be familiar with Hive and able to work effeciently to find solutions to big data problems
What you will learn
- Create and set up the Hive environment
- Discover how to use Hive's definition language to describe data
- Discover interesting data by joining and filtering datasets in Hive
- Transform data by using Hive sorting, ordering, and functions
- Aggregate and sample data in different ways
- Boost Hive query performance and enhance data security in Hive
- Customize Hive to your needs by using user-defined functions and integrate it with other tools
Who This Book Is For
If you are a data analyst, developer, or simply someone who wants to quickly get started with Hive to explore and analyze Big Data in Hadoop, this is the book for you. Since Hive is an SQL-like language, some previous experience with SQL will be useful to get the most out of this book.
Table of Contents
- OVERVIEW OF BIG DATA AND HIVE
- SETTING UP THE HIVE ENVIRONMENT
- DATA DEFINITION AND DESCRIPTION
- Data Correlation and Scope
- DATA MANIPULATION
- DATA AGGREGATION AND SAMPLING
- Extensibility Considerations
- Working with Other Tools
- Performance Considerations
- Security Considerations
商品描述(中文翻譯)
這本書帶您踏上一段奇妙的旅程,探索使用 Apache Hive 的大數據特性。
主要特點
- 掌握撰寫高效 Hive 查詢以分析大數據所需的技能
- 發現 Hive 如何與 Hadoop 生態系統中的其他工具共存並協同工作
- 使用實用的、以範例為導向的情境來涵蓋 Apache Hive 2.3.3 的所有新功能
書籍描述
在這本書中,我們首先介紹大數據領域的背景,並幫助您設置和熟悉 Hive 的工作環境,為您的大數據之旅做好準備。
接下來,這本書將引導您通過範例來發現和轉換大數據的價值。它還能提高您使用 Hive 語言的效率。最後,書中將重點介紹高級主題,如 Hive 的性能、安全性和擴展,這將引導您在這段值得的的大數據旅程中展開令人興奮的冒險。
到書籍結束時,您將熟悉 Hive,並能高效地找到解決大數據問題的方法。
您將學到的內容
- 創建和設置 Hive 環境
- 發現如何使用 Hive 的定義語言來描述數據
- 通過在 Hive 中聯接和過濾數據集來發現有趣的數據
- 通過使用 Hive 的排序、排序和函數來轉換數據
- 以不同方式聚合和取樣數據
- 提升 Hive 查詢性能並增強 Hive 中的數據安全性
- 通過使用用戶定義函數來自定義 Hive 以滿足您的需求,並將其與其他工具集成
本書適合誰
如果您是數據分析師、開發人員,或僅僅是想快速開始使用 Hive 探索和分析 Hadoop 中的大數據的人,這本書就是為您而寫的。由於 Hive 是一種類似 SQL 的語言,因此一些 SQL 的先前經驗將有助於您充分利用這本書。
目錄
1. 大數據與 Hive 概述
2. 設置 Hive 環境
3. 數據定義與描述
4. 數據關聯與範圍
5. 數據操作
6. 數據聚合與取樣
7. 擴展性考量
8. 與其他工具協作
9. 性能考量
10. 安全性考量