书籍详情
《社会调查数据管理:基于Stata 14管理CGSS数据(精装版)》[25M]百度网盘|亲测有效|pdf下载
  • 社会调查数据管理:基于Stata 14管理CGSS数据(精装版)

  • 出版社:人民邮电出版社
  • 出版时间:2016-06-01
  • 热度:8445
  • 上架时间:2024-06-30 08:52:20
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

编辑推荐

  1.专家推荐
  中国人民大学统计系教授,中国国家调查数据库项目负责人袁卫
  中国人民大学社会学系教授,长江学者,CGSS项目负责人李路路
  中国人民大学中国调查与数据中心王卫东

  2.填补空白
  大数据时代到来,各行各业对数据管理的需求应运而生,但很多相关人员尚未树立数据管理的意识,导致大量好数据零散地分布在各机构内,而且也很难对数据做合并以做进一步的挖掘分析。因此,急需一种适合中国国情的、专门针对社会调查数据的管理标准和管理流程,本书正是这样一本填补空白性的著作。

  3。实务手册
  本书旨在建立一套适合中国社会调查数据管理的、科学规范的、可重复的管理流程、管理标准和管理技术,同时本书又是一本关于社会调查数据管理的、实务性的操作手册。全书重点介绍了社会调查领域从问卷设计到数据发布期间所有和数据相关的管理工作,对数据分析人员来说,学会对各种不同的数据进行科学有效的管理,可极大的提高数据的使用效率和生命周期。
内容简介
  这是一本关于社会调查数据管理的实务操作手册,以国内综合性、长期性的调查数据——中国综合社会调查(CGSS)数据的管理为例,基于全新版的Stata 14软件,全面讲解了一个社会调查数据管理的完整周期,重点演示了社会调查数据管理工作中的重点和难点。本书适用于社会调查者、在校大学生、学者、研究者及其他和数据管理相关的从业者。为方便读者学习,书中所有示例数据及命令都可以从人民邮电出版社异步社区网站下载。
作者简介
  唐丽娜博士,中国人民大学“中国调查与数据中心”数据管理部主任,曾著有《中国综合社会调查(CGSS)实地抽样绘图手册》,主编《2012东亚社会调查(EASS)报告——社会网络与社会资本》等图书。
目录
版权信息
序一
序二
序三
作者序
致谢
第一部分 社会调查者的数据管理
第1章 导言
1.1 数据管理不被重视
1.2 数据管理内容不清
1.3 数据管理工作主体不明
1.4 数据伦理
1.5 本书简介和使用说明
第2章 数据管理的流程及内容
2.1 数据管理的工作流程
2.2 数据管理的工作标准
2.3 数据管理的工作规范
第3章 概念与术语
3.1 和计算机及软件有关的术语
3.2 和统计有关的术语
3.3 和社会调查有关的术语
3.4 Stata的一些术语及使用通则
3.5 中国综合社会调查
第4章 收集数据前的数据管理
4.1 问卷设计与数据管理
4.2 抽样设计与数据管理
4.3 数据管理人员的安排
4.4 访问员和数据管理
4.5 制定编码手册
第5章 收集数据中的数据管理
5.1 问卷填答
5.2 问卷回收与保存
5.3 问卷审核
5.4 问卷提交
第6章 数据录入
6.1 提交录入
6.2 录入格式
6.3 双录与双校
6.4 用Stata双录并双校数据
6.5 提交最终的录入数据
6.6 如何处理已经录完的问卷
6.7 数据合并
第7章 数据的初步清理
7.1 检查提交的录入数据
7.2 检查数据中的变量
7.3 检查数据中的取值
7.4 给取值添加多套不同语种的标签
7.5 给数据添加变量
7.6 删除数据中的敏感变量
7.7 保存数据及相关资料
7.8 如果问卷设计时没有编制编码手册,该怎么办
第二部分 数据使用者的数据管理
第8章 数据的深度清理
8.1 抽取数据
8.2 检验多个变量之间的逻辑关系
8.3 创建新变量
8.4 分组计算
8.5 转换数据形状
第9章 数据的保存和存档
9.1 保存数据
9.2 数据存档
第10章 数据发布
10.1 发布时间
10.2 发布格式
10.3 发布内容
10.4 Q&A
10.5 数据更新/更正
总结
附录
后记
参考资料
前言
  序一
  数据是这个时代的脉搏,和石油、矿藏等一样也是一个国家重要的资源。在学术领域,数据密集型驱动的学术研究范式日益盛行,数据已经发展成为一种重要的研究基础。在社会科学研究中,实证研究的前提是质量可靠的数据。在整个数据生命周期中,会有不同主体的参与,比如,研究者通常既是数据的生产者也是使用者,政府、学校和科研机构是产生数据的经费支持来源,也是推动数据开放和数据共享的重要推手。不同主体在数据生命周期中扮演着不同的角色,但是,有一点是所有参与主体必须关注的焦点——数据管理,这也是本书作者的研究重点。
  在社会科学领域,我国的实证研究起步较晚,“数据素养”有待提高,对数据的关注点几乎都聚焦在数据分析上。然而,数据采集和数据分析之间还有一座重要的桥梁,那就是数据管理。有过数据使用经历的人都知道,研究者或机构采集到的原始数据很难直接用于数据分析,需要对其进行一定的数据清理,如进行选取样本、选择变量、重新编码、插补缺失值、逻辑检验、基于原始变量创建研究所需的新变量、数据格式转换、数据形状转置等大量繁琐、复杂、耗时的工作,之后才能开始数据分析。对研究人员而言,这些和数据管理相关的工作往往会占据一项学术研究的一半甚至更多的时间。考察目前国内社会科学界几大旗舰项目发布的数据不难发现,我国的数据管理工作亟待改进和提高,几乎每个旗舰项目发布的数据在基本要素上都各有“特色”,即使在同一个项目数据的内部对同一个要素的操作都不统一、不规范,如数据中的变量名,有的用题号做变量名,有的用该变量对应的题目的英文缩写做变量名,还有的把题号和英文缩写合在一起做变量名,确立合适的社会科学数据管理标准迫在眉睫。
  本书正是应这样的数据需求而生,作者唐丽娜博士长期以来一直从事社会科学数据的采集、清理、管理、分析和挖掘工作,积累了丰厚的经验,而且全程参与中国国家调查数据库的建设和维护,对数据生命周期的各个环节都有着自己独到的见解。这本书是她对自己多年和数据打交道的一个阶段性总结,也是她对国内社会调查数据管理的大胆探索。
  国家是数据最大的生产者和使用者,数据管理更是一项国家战略,在数据开放和数据共享的大趋势下,建立规范、科学的数据管理变得愈发重要,而共享的前提是持续的、规范化的数据管理,否则结果只能是大量数据的无序集合而已。数据驱动型研究和数据导向型经济推动着社会各界对数据管理专业技术和专业人才的需要,我国在这方面仍处于起步、探索阶段,对涉及其中的主体和主体职责有待进一步的明确,社会调查数据的微观分享需要国家在宏观层面的政策支持和法律保护。
  目前,国际上对此已经做出了很多有益探索并提供了大量可供借鉴的案例和经验,如英国早在2000年就通过了信息自由法,而且在2004年成立了全球第一个专门从事数据管理研究和探索的机构——数据管理中心(Data Curation Center),为英国的数据管理提供了很多成功的案例、实用的管理工具及必要的技术培训。美国的NSF、NIH不仅强制要求接受资助的研究人员提交项目数据,而且提供专项基金用于研究数据管理。我国目前的数据封闭独享意识仍然存在,数据交换和共享尚未得到广泛认可,这极大地抑制了数据的学术效用和社会效益。希望这本书的出版,能够为国内社会科学领域中的数据管理、数据开放和共享提供想象的空间和讨论的基础。
  袁卫
  中国人民大学统计系教授,中国国家调查数据库项目负责人
精彩书摘
  数据!数据!数据!重要的事情说三遍!
  当前,越来越多的人意识到数据里包含着巨大的力量,潜在着无限的商机,无数的焦点都聚焦于数据,用事实说话已转变成用数据说话。虽然喜欢数据的人越来越多,但他们又恰恰不喜欢数据管理。
  目前,越来越多的人开始用数据说话,用量化研究方法研究社会问题,在大学里学到的数据管理方面的知识和技术越来越少。在这个浮躁社会里,当人们都急于用数据生产文章、生产书籍、生产财富时,没有多少人关注数据本身,只要有数据就用,不管数据质量如何,只是一味迷恋数据,而且这种迷恋日渐深入人心。他们关心的是数据带来的惊喜,分析和解释数据带来的满足感。很少有人关心数据,现在数据已经不仅仅限于一堆数字,还有文字、图片、视频等多种构成要素。这些数据要素本身都是一些客观存在,也有正确和错误之分,如果不对其善加管理,也会磨损、生锈,甚至最终消失。
  管理数据和使用数据是两个完全不同的工作,使用数据的人不一定会管理数据,毫不夸张地说,绝大部分使用数据的人甚至都不知道数据是需要管理的。我们是一个缺乏数据文化的国家,数据文化的缺乏是中国之所以落后的一个重要原因(涂子沛,2014)。在社会科学领域,我国的量化研究起步较晚,研究者的精力和时间都用在使用数据这件事上,对数据管理置若罔闻。他们不太关心数据是如何收集或生产出来的,这一点其实非常重要,如果收集数据的方法不科学,得到的数据还不如不用。令人不安的是,很多这种不是用科学严谨的方法收集到的数据,被用来“代表公众的想法”,甚至从中提出“科学的理论”。
  数据文化是尊重事实、强调精确、推崇理性和逻辑的文化(涂子沛,2014)。
  数据管理不被重视,原因很多,其中一个最重要的缘由当属数据管理的工作内容不清。数据管理,乍一听起来,好像知道是什么,但是真要动手做起来,就有些找不着北。特别是对社会调查数据来说,数据管理的界限更是一个让人头疼的问题。
  数据管理,简单地说,在社会调查中,凡是和数据有关的工作都属于数据管理的范畴,除此之外,当社会调查数据收集完成后,数据的录入、清洗、保存、存档、发布等也都是数据管理的重要组成部分。根据工作时间,可以把社会调查数据管理分为三个阶段:数据收集前的管理工作、数据收集过程中的管理工作和数据收集后的管理工作。
  当前,国内的数据管理做得非常浅,尤其是数据收集前的数据管理几乎无人问津,理所当然地认为这个阶段没有和数据有关的工作。实际上,撇开这个阶段的问卷设计和抽样设计等和数据管理息息有关的工作,单是编码手册的制定,就是任何一项数据管理的重中之重,它会直接影响到问卷设计、样本设计、数据采集、数据录入、数据清理。通常,数据收集后的管理阶段是很多人认为的数据管理,即便如此,这个阶段的工作也做得马马虎虎,很多社会调查项目都忽视了这个阶段的数据清理工作,以为把数据录入计算机后,得到的电子版数据能直接用于统计分析和学术研究,忽略了数据中多变量间的逻辑模式检验、对缺失值模式的设计、删除敏感信息/识别信息等。没有经过这些管理的数据,大多数都是糟糕的数据,不仅不利于学术研究和社会研究,而且有可能使研究结果产生误导性,甚至是灾难性的影响。
  目前,国内的数据管理不仅存在内容和方向问题,而且谁来管理数据也不太清楚。既然数据管理的工作内容都不明确,那么工作主体不明也是情理之中。数据管理主体不明的另一个重要因素是:国内极度缺乏社会调查数据管理人才,没有哪一所学校的哪个专业教授学生如何管理数据。
精彩插图