出于空间、时间以及经济等多方面客观因素的限制,在实践中仅可针对有限数量被试加以研究,即便是“大样本”,其样本量实际上也较为有限。此外,由于研究者对多样化样本进行亲自收集需要消耗大量研究成本,所以目前对于心理学领域的研究通常采取便于取样的方式,其被试大都为在校大学生,而且一般是具备西方文化、工业化、民主、富裕以及较高受教育程度等特征的群体。该种取样方式会呈现出较高的同质性,而且代表性较差,这对于研究结果解释和推广形成了一定限制。与之相比,来自于大型调查项目、专业机构以及行政部门的开放数据,通常包含数量更多的被试,而且调查对象覆盖面广,在年龄、社会地位以及种族等方面都有较大区别。比如世界价值观察至少涉及到全球90%以上的人口,而且在每个国家至少有1000人样本,时至今日已经累计约四百万个样本。规模如此之大,而且具有多元化特征的样本,对于以往大部分研究来说是无法想象的。然而,在每个人都可以对开放数据进行共享操作的今天,此种“大数据”已经变得唾手可得。随着大数据技术的高速发展,心理学研究甚至朝着“样本即为整体”的方向发展,继而大幅缩减元分析数量,通过开放性数据的应用,会让这一天尽早到来。
2.更灵活准确的分析
在调查项目当中,通常包含着很多问题,这也使研究人员通过多个角度应用这些问题形成了更大的便利。其一,与直接发放问卷对欲测变量进行测量的方式相比,以开放数据为基础调查项目能有效避免因为被试猜测研究目的而引发的要求特征问题。比如,在对影响主观幸福感的因素进行研究时,倘若在问卷上提出“金钱对你的重要性”等问题,非常可能会受到社会称许性影响。如果选用其它调查数据项目当中可以间接反映出金钱有关价值观的问题,其实际分析结果会更具真实性。其二,题目多样性能使研究人员依据具体研究目的进行灵活选择与解读。因此,应用开放数据让研究人员对于研究视角的选择更加灵活,便于构建相关理论。
与以往所使用具有笼统性的结果报告相比,专业领域开放数据内容更具全面性,而且可以展现更多的细节,实现更加精准的研究。比如,在研究传染病对于心理产生的影响时,以往由于传染病流行度相关数据模糊且有限,在统计过程中只能实现简单编码,而现在能够依靠查找开放数据的方式获得,在数据记录下也会展示更多的细节,而且所保存格式方便用于分析处理。
3.更高效经济的研究
倘若能利用既有开放数据防止重复测量或者无效测量的情况出现,并以此为基础更具针对性的进行数据收集,不仅可以在研究过程中节约大量金钱、时间和精力,还能有效克服小规模测量和小型数据集所带来的影响,使研究结果更具实效性。尤其是脑成像研究活动中,获取数据所用经济成本、管理数据所用时间成本都很大。某些临床研究中,通常要求控制组被试数据健康,而此种资源可以在网络开放数据当中直接找到,也就没有必要重复收集,实现资源的合理分配。目前,国内心理实验室所配置设备仍比较落后,很多一流大学的心理学系也存在试验空间和设备不足方面的问题,对基因、脑成像等相关领域开放数据的应用将会对教学与研究活动形成良好的支持。
(二)开放数据局限分析
1.数据重用信效度难保障
部分公开数据测得的心理变量所用心理学量表并不严格、标准,数据所反映问题跟研究变量不相符,亦或是出于使用人员未能充分了解数据准确含义,导致在研究活动中无法展现出良好的信效度。比如,在世界价值观调查当中,测量“信任”价值方面只设置了一道题“一般来说,你认为大部分人是可信任的,还是在与人相处时应该小心为妙?”,这导致部分研究人员对其可靠性产生了怀疑。虽然经过对比分析发现这个题目具有较强的实效性,但其中所提及的“大部分人”,在不同国家和地区却有着不同的范围认知,贫穷国家对这个范围的理解要更小。这种情况的出现说明:如果对其代表范围进行控制,随后再进行信任感比较研究,则各个国家之间会呈现出较大差异,但在以往的研究中通常不予控制。除此之外,因为对公开数据的跨领域使用,加之部分数据欠缺说明性文字,非常可能造成研究人员对于数据代表真实含义形成误解。
2.心理规范与技术的挑战
其一,就心理角度来说,很多研究人员欠缺数据分享动机,导致大量研究数据并未得以开放。有些研究人员担心自己将数据开放之后,同行业其他人会窃取自己的成果进行发表,亦或是其他人在对数据进行重新分析之后会对原有发现形成挑战。实际上,对于这部分不愿意进行数据分享的研究,即使已经出版,其中的数据依然有可能存在问题。其二,就规范角度来说,在行业、道德以及法律规范等方面并没有达成共识。面对将人类作为研究对象的活动,在道德层面的争论仍然存在,尤其是基因和脑成像等,相应数据可以被当作身份识别码,也因此会涉及到怎样平衡公众利益和个人隐私之间关系的问题。虽然可以从技术角度解决因此安全问题,但是开放数据可能导致被试相关信息在多个研究当中被重复利用,非常可能违背最初签订同意书的内容,并且很难由伦理审查部门进行审批与监督。其三,就技术角度来说,不管是数据开放者,还是获取者,都会出现一定技术知识普及和实际操作方面的问题。
结束语:
总而言之,将开放数据应用于心理学研究具有非常重要的现实意义,对于提高心理学研究效果,促进学术发展至关重要,值得我们投入更多时间和精力对其进行深入研究,为我国医学事业发展注入新的活力。
利用开放数据进行心理学分析(二)由毕业论文网(www.huoyuandh.com)会员上传。