本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
书名: | 大数据技术和应用(大数据人才培养丛书) |
出版社: | 清华大学出版社 |
出版日期 | 2019 |
ISBN号: | 9787302542193 |
这是一本大数据技术入门的简明教材。全书理论和实践相结合,以应用实战为主,深入浅出地讲解每个知识点,对每个应用实验按学习习惯,分步骤讲解,每个步骤都有文字说明和效果截图,使读者能清晰地知晓动手实操的效果和之处。 |
陈建平,讲师,技术总监,10年相关项目经历。长期从事大数据相关研究分析工作,曾担任IBM(上海)数据分析经理。 |
|
以Hadoop、Spark两大生态为基础,以大数据背景、软件、采集、存储、处理、分析、可视化、安全以及应用为线索,结合Flume、Sqoop、HDFS、HBase、Kafka、Kylin、Hive、Redis、MongoDB等主要组件技术,详解大数据技术基础。 |
|
第1章 了解大数据 1 |
当前,大数据(Big Data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发 展与创新。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然现在企业可能并没有意识到数据爆炸性增长带来的隐患,但是 随着时间的推移,人们将越来越多的意识到数据对企业的重要性。大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得 更为深刻、全面的洞察能力提供了的空间与潜力。 以至于不能用G或T来衡量,大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。 的高等学校教师积极投身课程体系和教材建设工作中,共同推动全国高等学校大数据教学工作不断向前发展。 了每个知识点,通俗易懂。对每个实验基本是按照学习的习惯,分步骤式地讲述,每个步骤都有文字说明和效果截图,使得读者能很 清晰地知晓自己在动手实操过程的效果和之处,一目了然。 等组件。在撰写过程中,参考了大量网络的资料,百度、谷歌、知乎、CSDN等知名网站,阅读了多种大数据相关方面的文献,对比了 各自介绍文章的优势和不足。 ;第3章着重介绍常见的数据采集器以及采集工具Flume和传输工具Sqoop;第4章着重介绍大数据存储相关的HDFS和NoSQL、Redis、 MongoDB、Neo4j等数据库;第5章着重介绍数据仓库Hive和大数据挖掘分析算法及应用;第6章着重介绍了Spark计算框架的原理机制 和处理技术;第7章着重介绍了大数据可视化原理和Tebleau、Power BI等工具;第8章分析了大数据技术目前所面临的安全挑战及其 对策;第9章对大数据技术的应用和发展做出了展望。全书提供了与章节学习内容配套的实验,重点章节配有习题。 部分,建议授课时间为第2学期或者第3学期。 言有一定了解;了解传统的数据库的理论知识。 充资料及时发布到官网,方便本书读者通过网络及时获取到相关信息。由于笔者能力有限,书中难免存在不足之处,望广大读者能够 提出宝贵意见。 卷和答案、实验环境、教学的微课、实验的视频,非常方便各高校教师的授课,相关的配套资源会在德明教育官网持续更新,欢迎大 家在线查看和下载。网页地址二维码如下:
|
清华大学出版社官方旗舰店