本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
本书共 14 章,内容涵盖:统计学的基本概念、推断性统计的相关理论和实例、方差分析、相关分析与回归分析、Logistic 回归、主成分分析与因子分析、聚类分析、判别分析、时间序列分析、SAS 编程基础、宏的概念和应用原理及上机练习指导。
本书内容全面,汇集了统计学、多元统计学和 SAS 编程技术的核心内容。本书针对不同的实战案例进行分析和总结,并展示了程序运行的结果,使之具有较强的可操作性,便于读者理解和研习。
本书可作为各行业数据分析师的应用参考书、开设数据分析课程高校中的教师讲义,以及希望进入数据分析领域人员的自学读物。
刘政博士
SAS中国研发中心总经理,负责此全球研发中心的整体运作;19年的外资企业经营和项目管理经验,丰富的信息技术和数据科学教育经验;中国软件行业协会理事,中国计算机学会大数据专家委员,清华大学大数据硕士项目教育指导委员会主任,中科院深圳先进技术研究院硕士研究生导师,北京大学、清华大学、中国科学技术大学讲席教授。
巫银良
SAS 中国研发中心技术总监,主要负责SAS 可视化分析(VA)、可视化数据挖掘与机器学习(VDMML)、商业智能和移动应用等产品线的研发管理。拥有近20年的计算机行业研发和管理经验,在企业应用和商业数据分析领域有着深厚的技术功底,著有《SAS技术内幕:从程序员到数据科学家》(2018)一书。北京大学《统计分析与商务智能》课程主讲。
左春琦
SAS中国研发中心自然语言处理软件开发工程师。北京大学、清华大学数据分析课程助理讲师。SAS中国数据分析大赛出题委员会委员。
李岚
SAS中国研发中心测试经理。十余年软件研发测试经验,涉及商业智能、数据分析、可视化展现、机器学习等各领域。北京大学《统计分析与商务智能》课程SAS编程讲师。
马晓丽
SAS 中国研发中心项目经理。十余年软件开发和项目管理经验,熟悉SAS风险管理解决方案以及SAS编程。清华大学《数据分析与优化建模》课程SAS编程讲师。参与SAS Little Book中文版翻译。
推荐者序一
在刚刚进入21 世纪的第二个十年,我们有一位研究生毕业以后加入了SAS 中国研发中心文本分析团队,由此,建立起了北京大学和SAS 之间的合作。我们经常会组织一些学术交流。SAS 总部领导到了北京以后,也会邀请我一同交流与沟通。那时候,社会上刚刚兴起大数据热,我们交流的题目都很热门,与以往其他企业的交流完全不一样。
经过一段时间的交流,我们之间有了很多的了解,我也在考虑为北京大学引入一门数据分析课程,把SAS 过去几十年的经验分享给同学们。2012 年上半年,我跟SAS 中国研发中心总经理刘政博士商量由他们在北京大学开设一门数据分析课程。刘政博士是SAS 中国研发中心总经理,负责SAS 全球三大研发中心之一的整体运作。刘政博士于2002 年回国,一直致力于提高中国高校在信息技术方面的教育水平。从 2003 年起,刘政博士参与了中国科学技术大学在北京的软件工程硕士项目的教学工作;在2012 年,他又积极推动开启了SAS 软件在中国高校的免费项目。当时,SAS 还没有为中国的大学提供免费的软件。
刘政博士开始跟美国总部进行沟通,经过几个月的不懈努力,SAS 第一个中国大学校园项目落户北京大学。
2012 年秋季学期,由SAS 中国研发中心总经理刘政博士带领的团队正式在北京大学信息科学技术学院开设研究生和本科生合上的公选课程“统计分析与商务智能”。这是SAS 公司首次与中国高校联合开设课程。该课程由一线高级工程师介绍前沿的大数据分析技术,受到了来自信息学院、数学学院、元培学院、光华管理学院、工学院等选课学生的广泛好评。2020 年已经是这门课程开设的第九个年头。随着大数据和人工智能的发展,会有越来越多的学生选修这门课程。
大数据是计算机应用和互联网发展带来的时代产物。它的出现让一切都有迹可循,有源可溯。我们每天都在生产和使用数据,而且我们一直都生活在一个大数据时代里,只是我们浑然不觉。由于技术的局限性,人们在很长一段时间里没有办法使用这些集容量大、种类多、增长速度快等特征于一身的全量数据。随着技术的发展与创新,大数据分析正在成为各行各业的必备技能,以及企业管理和决策的重要依据。因此,大数据分析在生产活动中扮演着越来越重要的角色,很多新兴行业,譬如物联网、人工智能、金融科技、生命科学等都是建立在这一基础之上的。电商等互联网企业在拥有了海量的用户数据之后,开始着手开展各类数据分析工作,以支撑自身的电子商务、定向广告和影视娱乐等业务。面对快速增长的个人贷业务及不断变化的个贷市场环境和政策,某银行基于大数据分析突破了传统审批流程和风险控制过程中的业务发展“瓶颈”,在市场竞争中迅速准确地制定相关的贷款政策,量化控制风险率、批准率。零售企业通过大数据建立用户画像,并监控营销活动的实时数据,确定最佳营销方案,实现精准营销。制造行业通过收集流水线上各种仪器的参数数据,找到更优的工艺参数,从而降低生产成本,提高生产效率。这些具有大数据分析战略和能力的企业终将在市场上占据主动。
大数据分析战略着眼于对数据进行专业化处理,其重点应在“分析”二字,而不仅仅是获取海量数据。当前有关大数据的信息繁多,谈的问题都不太系统,谈技术的多,谈分析的少。如何进行有效的数据处理、分析,找出数据内部蕴含的模式和规律才是大数据分析的根本。而数据分析能力的强弱将直接影响一个企业对数据的使用情况,也能反映其在市场上的竞争力。猎聘2019 年大数据人才就业趋势报告显示:中国大数据人才缺口高达150 万人,其中需要具备行业背景知识的大数据分析行业,如金融领域的数据分析行业,尚未完全开启的人工智能、物联网、智慧城市等新兴行业,未来将有大量的人才需求。海量信息的搜索、实时通信工具的信息传递、引发亿级流量的电商购物、亿万游戏玩家的数据信息处理、互联网金融的风险控制等,都需要大量的数据分析人才。所以数据分析人才正在成为这个时代的宠儿。
大数据分析不仅涉及计算机软件开发领域的专业技能,还涉及数学和统计相关学科的理论知识。在时代需求的背景下,北京大学信息科学技术学院与SAS 中国研发中心自2012 年起展开合作,成功开设了运用SAS 进行数据处理、数据分析的课程,为北京大学各专业的学生提供了学习并实践数据分析的机会。SAS 公司专门为该课程提供了免费使用的商业软件。该课程很好地结合了数据分析的理论知识、实用案例分析、软件使用和程序编写,给学生创造了一个深入浅出的学习曲线。借此契机,SAS 中国研发中心的教师秉持SAS 在数据分析领域的专注和严谨,通过总结日常学生的课堂反馈和学习成果,不断改进课程内容编排并适时地与当前大数据分析的趋势相结合,经过几个月的精心编写,完成了《数据分析实用教程》一书。
本书着眼于实战,汇集了统计学、多元统计学和SAS 编程分析技术的核心要点,以清晰的学习脉络为引导,并辅以贯穿各种分析案例的简洁的分析代码。本书开篇生动有趣地介绍了统计学代表人物的故事,向读者描绘了一幅清晰完整的统计学发展历程,对多种统计思维模式做了集中介绍,为接下来的统计学基本概念、描述性统计、推断性统计等内容的讲解奠定了基础。本书以方差分析、相关分析与回归分析、Logistic 回归、主成分分析与因子分析、聚类分析、判别分析、时间序列分析为重点,介绍了各类分析的基本思想和概念;结合实际案例数据和详细的分析过程,对分析思想进行了全面细致的介绍,使统计分析的理论知识和现实应用相呼应,具有很强的可操作性,易于理解和研习。
作者融入了多年的统计分析经验,总结了不同分析方法之间的特点,对各方法的应用场景和注意事项提出了独到的见解,通过大量统计分析图形和细致的分析报告展示了重点内容,并辅以SAS 程序的分析结果对前面的知识点进行了印证。更难能可贵的是,即使没有任何SAS 编程经验的初学者,也能通过自学开始一段奇妙的SAS 数据分析之旅。
本书配套提供了完整的课件、练习数据和课后实践代码,为使用本书的授课教师节省了大量时间。同时授课高校可以获得SAS 公司的软件支持,方便师生使用。对于自学的读者,该书提供了SAS 免费软件SAS University Edition 的专题介绍,读者可以按照操作步骤自行搭建SAS 软件的运行环境,通过运行教程中的SAS 程序或自行编写的程序,真正做到理论与实践相结合。
本书用翔实的内容、独到的实践总结和完备的课件,充分展现了作者的诚意和对推动数据分析人才建设的初心,旨在为有志成为新一代数据分析人才的读者提供一本高效实用的学习教程,帮助他们在大数据分析的浪潮中积蓄力量。根据我八年来与SAS 团队的合作经验,这是一本值得推荐的好书。
北京大学教授
张铭博士