本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
图书基本信息 | |
书名: | Hive编程 |
丛书名: | |
作者/主编: | (美) 卡普里奥罗 |
出版社: | 东南大学出版社 |
ISBN号: | 9787564141974 |
出版年份: | 2013年5月 |
版次: | 第 1版 |
页数: | 328页 |
开本: | 16 |
图书定价: | 54元 |
实际重量: | 0.599kg |
新旧程度: | 正版全新 |
作者:(美国)卡普里奥罗(Edward Capriolo) (美国)万普勒(Dean Wampler) (美国)卢森格林(Jason Rutberglen)
卡普里奥罗(Capriolo E.),是Media6degrees的系统管理员,也是Apache软件基金会的成员和Hadoop—Hive项目的委员之一。
万普勒(Wampler D.),是Think Big AnalytiC S公司的资深咨询顾问,他专长于大数据问题以及诸如HadOOP这样的工具和Machine Learning(机器学习)。
卢森格林(Jason R.),是Think BigAnalytics公司的软件架构师,他专长于大数据、Hadoop、搜索和安全。
Preface
1. Introduction
An Overview of Hadoop and MapReduce
Hive in the Hadoop Ecosystem
Pig
HBase
Cascading, Crunch, and Others
Java Versus Hive: The Word Count Algorithm
What's Next
2. Getting Started
Installing a Preconfigured Virtual Machine
Detailed Installation
Installing Java
Installing Hadoop
Local Mode, Pseudodistributed Mode, and Distributed Mode
Testing Hadoop
Installing Hive
What Is Inside Hive?
Starting Hive
Configuring Your Hadoop Environment
Local Mode Configuration
Distributed and Pseudodistributed Mode Configuration
Metastore Using JDBC
The Hive Command
Command Options
The Command-Line Interface
CLI Options
Variables and Properties
Hive "One Shot" Commands
Executing Hive Queries from Files
The hiverc File
More on Using the Hive CLI
Command History
Shell Execution
Hadoop dfs Commands from Inside Hive
Comments in Hive Scripts
Query Column Headers
3. Data Types and File Formats
Primitive Data Types
Collection Data Types
Text File Encoding of Data Values
Schema on Read
4. HiveOt: Data Definition
Databases in Hive
Alter Database
Creating Tables
Managed Tables
External Tables
Partitioned, Managed Tables
External Partitioned Tables
Customizing Table Storage Formats
Dropping Tables
……
5. HiveQL: Data Manipulation
6. HiveQL: Queries
7. HiveOL:Views
8. HiveQL: Indexes
9. Schema Design
10. Tuning
11. Other File Formats and Compression
12. Developing
13. Functions
14. Streaming
15. Customizing Hive File and Record Formats
16. Hive Thrift Service
17. Storaae Handlers and NoSOL
18. Security
19.Loching
20. Hive Integration with Oozie
21. Hive and Amazon Web Services (AWS)
22. HCatalog
23. Case Studies
Glossary
Appendix: References
Index
你是否需要把一个关系型数据库应用迁移到Hadoop上?卡普里奥罗等著的《Hive编程(影印版)》这本全面的指南将为你介绍Apache Hive,它是Hadoop的数据仓库平台。你将快速了解如何使用Hive的SQL方言——HiveQL——来汇总、查询和分析存储在Hadoop分布式文件系统中的大数据集。
《Hive编程(影印版)》为你展数据库应用于示了如何在你的环境中搭建和配置Hive,它也提供了对Hadoop和Map Reduce的概括介绍,并且演示了Hive是如何在Hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用Hive的公司是如何解决PB容量数据层面上的独特问题。