本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
Hive 编程技术与应用 | ||
定价 | 28.00 | |
出版社 | 中国水利水电出版社 | |
版次 | 1 | |
出版时间 | 2018年11月 | |
开本 | 16开 | |
作者 | 孙帅,王美佳 | |
装帧 | 平装-胶订 | |
页数 | ||
字数 | ||
ISBN编码 | 9787517069140 |
前言
章 Hive介绍
1.1 Hive工作原理
1.2 Hive的数据类型
1.3 Hive的特点
1.4 本章小结
第2章 Hive架构
2.1 Hive用户接口
2.1.1 Hive CLI
2.1.2 HWI
2.1.3 Thrift服务
2.2 Hive元数据库
2.2.1 Hive元数据表结构
2.2.2 Hive元数据的三种存储模式
2.3 Hive数据存储
2.4 Hive文件格式
2.4.1 TextFile格式
2.4.2 SequenceFile格式
2.4.3 RCFile格式
2.4.4 ORC格式
2.5 本章小结
第3章 HiveQL表 作
3.1 内部表
3.2 外部表
3.3 分区表
3.3.1 静态分区
3.3.2 动态分区
3.4 桶表
3.5 视图
3.5.1 使用视图降低查询复杂度
3.5.2 使用视图来限制基于条件过滤的数据
3.5.3 动态分区中的视图和map类型
3.6 本章小结
第4章 HiveQL数据 作
4.1 装载数据到表中
4.2 通过查询语句向表中插入数据
4.3 单个查询语句中创建并加载数据
4.4 导出数据
4.5 本章小结
第5章 HiveQL查询
5.1 SELECT…FROM语句
5.1.1 使用正则表达式来指定列的
5.1.2 使用列值进行计算
5.1.3 算述运算符
5.1.4 使用函数
5.1.5 LIMIT语句
5.1.6 列别名
5.1.7 嵌套SELECT语句
5.1.8 CASE…WHEN…THEN语句
5.2 WHERE语句
5.2.1 谓词 作符
5.2.2 关于浮点数比较
5.2.3 LIKE和RLIKE
5.3 GROtJPBY语句
5.4.JOIN语句
5.4.1 INNER JOIN
5.4.2 JOIN优化
5.4.3 LEFTOUTER JOIN
5.4.4 R1GHTOUTER JOIN
5.4.5 FULLOUTER JOIN
5.4.6 LEFT SEMI JOIN
5.4.7 笛卡尔积JOIN
5.4.8 mad-side JOIN
5.5 ORDER BY和SOPT BY
5.6 含有SOftT BY的DISTRIBIJTE BY
5.7 CLUSTER BY
5.8 类型转换
5.9 抽样查询
5.9.1 数据块抽样
5.9.2 分桶表的输入裁剪
5.1 0LINIONALL
5.1 1本章小结
第6章 Hive配置与应用
6.1 Hive安装与配置
6.2 Hive访问
6.3 Hive基本 作
6.3.1 Hive CLI命令行 作讲解
6.3.2 Hive的数据类型
6.3.3 Hive表的创建
6.3.4 Hive数据导入
6.3.5 Hive数据导出
6.4 Hive数据定义
6.4.1 内部表与外部表的区别
6.4.2 内部表建立
6.4.3 外部表建立
6.4.4 表的分区与桶的建立
6.4.5 删除表与修改表结构
6.4.6 HiveQL简单查询语句
6.4.7 WHERE语句
6.5 Hive高级查询
6.6 本章小结
第7章Hive自定义函数
7.1 LIDF
7.2 UDTF
7.3 UDAF
7.4 Hive函数综合案例
7.4.1 Row-Sequence实现列自增长
7.4.2 列转行和行转列
7.5 本章小结
第8章Hive综合案例(一)
8.1 项目背景与数据情况
8.2 关键指标KPI
8.3 开发步骤分析
8.4 表结构设计
8.5 数据清洗过程
8.5.1 定期上传日志至HDFS
8.5.2 编写.MapReduce程序清理日志
8.5.3 定期清理日志至HDFS
8.5.4 查询清洗前后的数据
8.6 数据统计分析
8.6.1 借助Hive进行统计
8.6.2 使用HiveQL统计关键指标
8.7 本章小结
第9章Hive综合案例(二)
9.1 项目应用场景
9.2 设计与实现
9.2.1 日志格式分析
9.2.2 建立表
9.2.3 程序设计
9.2.4 编码实现
9.2.5 运行并测试
9.3 本章小结
0章Hive综合案例(三)
10.1 应用场景
10.2 设计与实现
10.2.1 数据处理
10.2.2 使用Hive对清洗后的数据进行多维分析
10.2.3 在MySQL中建立数据库
10.2.4 使用sqoop把分析结果导入到MySQL中
10.2.5 程序设计与实现
10.2.6 运行并测试
10.3 本章总结
附录
显示全部信息