书籍详情
《正版Hive编程卡普里奥罗东南大学出版社全新考研大中专教材9787564141974》[31M]百度网盘|亲测有效|pdf下载
  • 正版Hive编程卡普里奥罗东南大学出版社全新考研大中专教材9787564141974

  • 热度:8325
  • 上架时间:2024-06-30 08:52:20
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍



图书基本信息
书名: Hive编程 
丛书名:  
作者/主编:   (美) 卡普里奥罗 
出版社:   东南大学出版社 
ISBN号:  9787564141974
出版年份: 2013年5月    
 
版次:  第 1版
页数:  328
开本:  16
图书定价:  54
实际重量:  0.599kg
新旧程度:  正版全新




作者:(美国)卡普里奥罗(Edward Capriolo) (美国)万普勒(Dean Wampler) (美国)卢森格林(Jason Rutberglen) 

卡普里奥罗(Capriolo E.),是Media6degrees的系统管理员,也是Apache软件基金会的成员和Hadoop—Hive项目的委员之一。 
万普勒(Wampler D.),是Think Big AnalytiC S公司的资深咨询顾问,他专长于大数据问题以及诸如HadOOP这样的工具和Machine Learning(机器学习)。 
卢森格林(Jason R.),是Think BigAnalytics公司的软件架构师,他专长于大数据、Hadoop、搜索和安全。



Preface 
1. Introduction 
An Overview of Hadoop and MapReduce 
Hive in the Hadoop Ecosystem 
Pig 
HBase 
Cascading, Crunch, and Others 
Java Versus Hive: The Word Count Algorithm 
What's Next 
2. Getting Started 
Installing a Preconfigured Virtual Machine 
Detailed Installation 
Installing Java 
Installing Hadoop 
Local Mode, Pseudodistributed Mode, and Distributed Mode 
Testing Hadoop 
Installing Hive 
What Is Inside Hive? 
Starting Hive 
Configuring Your Hadoop Environment 
Local Mode Configuration 
Distributed and Pseudodistributed Mode Configuration 
Metastore Using JDBC 
The Hive Command 
Command Options 
The Command-Line Interface 
CLI Options 
Variables and Properties 
Hive "One Shot" Commands 
Executing Hive Queries from Files 
The hiverc File 
More on Using the Hive CLI 
Command History 
Shell Execution 
Hadoop dfs Commands from Inside Hive 
Comments in Hive Scripts 
Query Column Headers 
3. Data Types and File Formats 
Primitive Data Types 
Collection Data Types 
Text File Encoding of Data Values 
Schema on Read 
4. HiveOt: Data Definition 
Databases in Hive 
Alter Database 
Creating Tables 
Managed Tables 
External Tables 
Partitioned, Managed Tables 
External Partitioned Tables 
Customizing Table Storage Formats 
Dropping Tables 
…… 
5. HiveQL: Data Manipulation 
6. HiveQL: Queries 
7. HiveOL:Views 
8. HiveQL: Indexes 
9. Schema Design 
10. Tuning 
11. Other File Formats and Compression 
12. Developing 
13. Functions 
14. Streaming 
15. Customizing Hive File and Record Formats 
16. Hive Thrift Service 
17. Storaae Handlers and NoSOL 
18. Security 
19.Loching 
20. Hive Integration with Oozie 
21. Hive and Amazon Web Services (AWS) 
22. HCatalog 
23. Case Studies 
Glossary 
Appendix: References 
Index


 你是否需要把一个关系型数据库应用迁移到Hadoop上?卡普里奥罗等著的《Hive编程(影印版)》这本全面的指南将为你介绍Apache Hive,它是Hadoop的数据仓库平台。你将快速了解如何使用Hive的SQL方言——HiveQL——来汇总、查询和分析存储在Hadoop分布式文件系统中的大数据集。
  《Hive编程(影印版)》为你展数据库应用于示了如何在你的环境中搭建和配置Hive,它也提供了对Hadoop和Map Reduce的概括介绍,并且演示了Hive是如何在Hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用Hive的公司是如何解决PB容量数据层面上的独特问题。