导图社区 第四章 研究数据的整理与处理
心理学研究方法:信度与效度问题,整理了原始数据的整理、数据的转换、测量的信度与效度的内容,欢迎查看。
编辑于2023-04-14 16:16:32 江西研究数据的整理与处理
原始数据的整理
数据整理是了解研究结果、进行进一步统计的重要步骤。获得原始数据后研究者要按照一定规范或相应群体可接受的方式对数据进行整理和处理,这些规范可能包括如何处理极端数据,如何对待不符合假说的数据
整理原始数据的方法
极端数据的剔除或替代
按照平均数加减3个标准差的原则来处理极端数据
处理方法 【具体可用excel操作】
平均数替代【无意义】
假设该极端数据不反映任务难度、加工深度等任何信息,仅仅是一个“意外”
用上限或下限对应的边缘值替代【有意义】
该极端数据传达了一定的信息,可能反映了加工的难度太高或太低等,获得的所有数据是一个连续体,只是该极端数据远远偏离了平均数,但偏离的方向和距离是有意义的
观察描述统计的结果
进行统计检验之前,对研究者非常重要的是观察一组数据的分布情况以及平均数、标准差、基本相关等描述统计数据,这可以使研究者对如何进一步处理数据做到心中有数
平均数和标准差等描述统计能帮助研究者了解初步结果的性质,确定进一步研究方向或进一步的统计方法分析
描述统计结果是基于有效实验数据的,有效是相对无效而言的,如以反应时实验数据处理为例,无效数据指错误反应和极端数据,所以反应时描述统计是对这两组数据处理后得到的
数据的转换
转换是指对一组数据进行系统的转变,研究者有时需要在正式数据处理之前对原始数据进行转换
转换原因
原始数据不能很好地满足F检验的需要
研究者希望获得误差变异的同质性
使原始数据接近正态分布
希望减少误差变异
原始数据中有极端值
转换条件
一般来说,当处理水平的平均数和误差变异是百分率时,以及当误差变异的分布是同质时,可以使用数据转换
数据转换的方法
平方根转换
转换条件:处理水平的平均数和变异都是可表示为百分数的。当因变量是一个出现的可能性很小的小概率事件时,经常会出现符合泊松分布(在单位时间/空间内出现随机事件的次数,且上一次与下一次之间相互独立)
转换公式:Y'=根号Y(Y是原始分数),如果Y<10,转换公式:Y'=根号Y+0.5/ 根号Y+根号Y+1
转换后:数据的平均数和变异不再是可表示为百分数的,数据的变异更加同质(全距减小,标准差减小),比原始分数更适合进行方差分析
log转换
转换条件:处理水平的平均数和标准差是可表示为百分数的;数据呈现正偏态分布时
转换公式:Y'=log10Y; 当原始分数数值很小或者是0时,转换公式:Y'=log10(Y+1)
转换后:数据的标准差减小;数据分布更加接近正态分布
角度转换
转换条件:数据中个处理水平的的平均数和变异是可以表示为百分数的,同时数据分布中有极值的时候
转换公式:Y‘=2 arcsinY^1/2
转换后,数据更加接近正态分布,更适合进行方差分析
转换方法的选择
考虑数据的性质,是不是可表示为百分数的——平方根转换; 考虑数据中是否含有1和0-极值,是否偏正态分布——log转换; 考虑数据的数值大小,是否含有大量0或接近0的数值——角度转换
若关心如何减小误差变异时,可以采取尝试每一种转换方式来确定转换方法;具体步骤如下:第一步,找到每一个处理水平的最大值和最小值; 第二步:确定每个处理水平内的全距(最大值-最小值); 第三步:计算全距最大值与最小值的比率; 第四步:分别计算平方根转换分数和log转换分数,找到每一个处理水平的最大值和最小值,并计算最大值与最小值的比率; 最后比较原始分数,转换后分数的全距比率,得到比率最小的转换方法就是最合适的。
数据转换的前提是存在处理效应
测量的信度与效度
信度
含义
信度是指测量结果的稳定性程度,即用同一测量工具反复测量同一事物所得结果间的一致性程度,有时也叫测量的可靠性
定义3:信度是一个测验X(如A卷)和它的任意一个平行测验Y(如B卷)的相关系数(这个定义具有实际意义)
作用
信度是衡量一个量表质量高低的重要指标之一,具体表现在: 1.信度是测量过程中存在的随机误差大小的反映。 信度低说明随机误差很大,测量结果与真分数发生较大偏差,让人无法相信测量结果,特别指处,测量中系统误差与信度无关; 2.信度可以用来解释个人测验分数的意义; 3.信度可以帮助进行不同测验分数的比较
影响信度的主要因素
凡能引起随机误差的因素—被试,主试,测试内容,施测情境等都会影响测量信息
被试方面
单个被试——身心健康状况,应试动机,注意力,耐心,求胜心,作答态度等会影响测量信度【这些会影响被试心理特质水平的稳定性】
团体被试——整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度【影响相关系数值,导致信度被低估或高估】
主试方面
施测者——未按指导手册规范施测,故意制造紧张气氛,暗适,协助等会导致信度大大降低
阅卷评分者——评分标准掌握不一,前紧后松,随心所欲等也会降低测量信度
施测情境方面
周围是否安静,光线通风是否良好,所需设备是否齐全,空间宅阔是否恰当等可能影响测量信度
测量工具方面
测量工具性能是否稳定是测量工作成败的关键,一般试题的取样,试题之间的同质性程度,试题的难度是影响测验稳定性的主要因素【可用斯皮尔曼-布朗公式计算】
两次施测的间隔时间
两次测验时间间隔越短信度越高,时间越长,其他因素带来的影响就多,因而测量的信度越低
提高信度测量的常用方法
适量增加测验的长度
使测验中所有试题的难度接近正态分布,并控制在中等水平
努力提高测验试题的区分度
选择恰当的被试团体,提高测验在各同质性较强的亚团体上的信度
主试严格执行实测规程,评分者严格按照标准给分,实测场地按测验手册的要求进行布置,减少无关因素的干扰
效度
指一个测验或量表实际能测出其所要测的心理特质的程度。效度是一个相对的概念,即相对于某一特定目的而言的;效度是测量的随机误差和系统误差的综合,只要出现测量误差,效度必然受到影响;判断一个测量是否有效要从多方面收集证据,获取效度的办法必须从多角度把要测量的特质描述清楚,可以是理论的也可以是实践上的,而不能直接将测量结果与心里特性进行比较,因为它是未知的,抽象和隐蔽的
效度与信度的关系
信度高是效度高的必要而非充分的条件,随机误差的减小能够提高测验信度,但是否提高效度还要看系统误差的大小,可见信度高不一定效度高,但想要效度高,信度必须高
测验的效度总是受它的信度制约
实验效度的种类 (实验方法能达到实验目的的程度)
构想效度
指研究中所包含的自变量和因变量操作定义的恰当性
内部效度
指实验中的自变量与因变量之间因果关系的明确程度,反映的是一个实验在方法学上的合乎逻辑的程度,以及不受混淆因素影响的程度。任何为加控制的额外变量都会降低研究的内部效度
外部效度
指研究发现能够普遍推广到样本来自的总体以及其他同类现象中去的程度,即实验结果的普遍代表性和适用性。外部效度涉及三个方面:其他总体,其他环境,其他时间
统计结论效度
指在多大程度上研究者恰当的运用统计学,并且由统计分析得出合适的结论。影响统计结论效度的因素有:研究者进行了错误的统计分析,或违反进行特定统计分析所要求的一些基本假设;研究者选择性的报告分析结果,即只报告那些符合自己预期的结果;尝试不同类型的统计分析,直到发现“显著”的结果为止,这增加了犯Ⅰ型错误的几率;因变量指标不稳定
影响测量效度的因素
测验的构成
试题样本不嫩很好代表欲测内容和结构时,测量内容效度和结构效度就不会高,同时题目语义不清,指导语不明,题目太难,太少等也会降低效度
测验的实施过程
不遵从指导语要求,出现意外干扰,评分计分出差错都会降低效度
接受测验的被试
被试的动机,情绪,态度,身体状态等会影响信度,造成较大的随机误差,进而影响效度;就团体被试而言,缺乏同质性肯能出现测验偏差
所选校标的性质
校标的选择要符合相关系数要求
测量的信度
信度不高,效度不可能高
提高测量效度的方法
要想提高测量效度,就必须设法控制随机误差,减小系统误差,同时选择好特别恰当的校标,把效度系数准确的算出来
精心编制测量表,避免出现较大的系统误差
妥善组织测验,控制随机误差
创设标准的应试环境,让每个被试都能发挥正常的水平
选择正确的校标,定好恰当的测量校标,正确使用有关公式