第二节
心理测量的性质
一、什么是测量
测量通常是指根据一定法则给事物特性指派一定的数字的过程,它是人们认识客观世界的有效方法。
客观世界的事物名目繁多,特性迥异,要确定某一事物的某一特性,就必须依据一定的规则或方法进行测定,并将测定的结果用数字表示出来。在人们日常生活中,测量是被普遍运用的方法。例如,人们用天平、磅秤测定物体的质量,用米尺测量物体的长度,用量筒测量液体的体积,用温度计测定物体的温度等,这些都是人们日常生活中所进行的测量。这些测量并非是随意定夺,而是按照一定的原理和规则,使用一定的量具进行的。这些日常用的磅秤、天平、米尺、量筒等就是量具。人们正是凭借着测量手段,对客观事物进行数量的测定,从而更好地认识事物和对事物进行分析比较的。
史蒂芬斯(S.S.Stevens)说:“就其广义来讲,测量是按照法则给事物指派数字。”这个定义简要地说出了测量的基本性质,它主要包括以下三个要素:测量的对象、测量的结果、测量的方法。下面我们对这三个要素进行分析。
(一)测量的对象——事物属性
根据能否直接测量,我们可将事物属性分为两类:一是可直接测量的事物属性,如长度、体积、质量等;一是只能间接测量的事物属性,如温度、心理等。温度是用热胀冷缩的原理制作的温度计来间接测量的;人的心理是人脑的内部活动,只能根据人的行为反应来加以推测。由此可以看出,心理测量是对心理的间接测量,它是通过测量行为样组来推断人的心理。所谓行为样组就是测验选择的一组有代表性的行为。
(二)测量的结果——数字
测量的结果用数字来表示,因为数字具有优良的特性,能较精确地描述事物的各种属性。数字具有区分性,它可将事物按不同属性分类;数字具有顺序性,它可描述事物大小、先后、快慢等属性;数字具有等距性,它可精确地刻画事物在量上的差异;数字具有零,它可表示事物的比率关系。
应该指出的是,在不同的测量中,测量结果所使用的数字可能具有不同的特性。有时它只具有区分性,这时的数字不具有量上的意义,只具有对事物质上的区分。因此,不是所有的测量结果都是量化的。关于测量结果的数字性质,我们将在四种测量量表中进一步分析。
(三)测量的方法——法则
如何给事物指派数字,这就是测量的法则问题。所谓法则就是确定事物的属性与数字之间的对应关系。例如,我们要评定学生的品德,这时法则就可以描述为:“根据学生表现好坏的程度分派1—5的数字,非常好的学生分派数字 ‘5',极差的学生分派数字 ‘1',而介于两极端中间的学生,则分派数字 ‘2'— ‘4'。”又如,假设我们已有一个法则:“男性指派数字 ‘0',女性指派数字 ‘1'。”
对于测量法则,我们还可以用函数式来表达:y=f(x)。这里x表示事物属性,y表示应指派的数字,即测量结果;f表示函数关系,这里表示测量法则。根据这个函数式,只需给出一个x1,就能得到一个对应的y1;给出一个x2就能得到一个对应的y2;以此类推,可得到任何一个xi所对应的yi。
法则有好有坏,使用好的法则就可以得到精确的测量结果,使用不好的法则,就会得到不精确的测量结果。许多事物易于测量,主要是因为它们所使用的法则易于制定和便于操作,如性别、发色、肤色、身高、体温、体重等都是容易测量的。可是大部分人类心理特征都是难以测量的,原因就在于设计一个好的且清晰的法则很困难。心理测量的工具是心理量表,在这个意义上,它就体现了法则。心理量表编制的好坏,就意味着法则的好坏,其结果决定了心理测量的可靠性和有效性程度。
法则的好坏可用同构性程度来表示。同构性高是指根据法则指派的数字与事物属性相一致。制定好的法则是测量中最重要也是最困难的任务。
二、测量的量表
(一)量表
测量时将测量对象放在一个有参照点的连续体上,以便得到一个测量值,这个连续体称为量表。下面将介绍一下关于量表的几个基本概念。
1.单位
单位是计量事物的标准量的名称。例如,测量长度以“米”为单位,测量质量以“千克”为单位。如果没有单位,则数量的多少和物体的大小就无法表示。好的单位应满足以下两个条件:第一,要有确定的意义,即同一单位在所有人的心目中都有同一意义,不应有异议和多义。例如:1千克、1米、1小时、1千米等其意义十分明确,所有人的理解都是一致的。第二,单位的距离要等值,即每一单位在连续体上所占的位置长度相同。但是,在心理和教育测量中所用的单位大多是不等值的。例如,有A、B、C、D四个学生,在某次测验中,他们的成绩分别为20分、30分、50分、60分,那么,我们能否说A、B的学业水平之差和C、D的学业水平之差相等呢?对此,我们无法肯定。因为各测题的难度不同,所花费的心理能量也是不等的,也就是说各测题的分数单位是不等的。
2.参照点
所谓参照点,又叫零点,就是计算的起点。如果参照点不同就无法进行直接比较。例如,摄氏温度与华氏温度由于参照点不同,两者就不能直接进行比较,须经过换算方能进行比较。参照点有两种:
(1)绝对零点。这是真正意义上的零点。例如:长度、质量都有绝对零点。
(2)相对零点。这是人为确定的零点。例如:测量陆地高度就是以海平面为相对零点的,摄氏温度计是以冰点为相对零点的。
教育和心理测量中使用的参照点都是相对零点。例如,在某次测验中得零分的学生未必对该测验的内容有关的知识一点也不懂。但这种人为确定的参照点只能表示差异的大小,而不能表示倍数。例如,A、B两个学生,在英语测验中,A得了20分,B得了40分,我们此时只能说B比A的成绩高20分,而不能说B是A的2倍。
(二)四种测量量表
由于制作量表的单位、参照点的种类不同,量表的水平也就不同。量表从低级到高级、从简单到复杂,排列起来可以分为:类别量表、等级量表、等距量表和比率量表。各种量表的性质是不同的。高级量表除具有低级量表的全部特性外,还有自己独特的性质。
1.类别量表(Nominal scale)
类别量表又叫名称量表,就是依据某一特点,对两个或两个以上的对象进行分类,并用一定的数字(或符号)加以表示。这里的数字没有任何数量大小的含义,只是不同类别的表征。
例如,交通部门规定A省的汽车用“05—”表示,B省的汽车用“08—”表示,C省的汽车用“10—”表示。
在电子线路中,用“1”表示高电位,用“0”表示低电位。上面各个例子中做标记的数字并不表示大小或多少,只是起到某种名称符号的作用。当我们看到“05—”这样标记牌号的汽车时就知道是A省的汽车,当看到“10—”牌号的汽车时就知道是C省的汽车,这是由于数字在此时代表了某个事物或者某类事物。另外,类别量表中的数字没有序列性、可加性、等距性。它们适用的统计方法均属于次数的统计。例如,百分比、χ2检验。
2.等级量表(Ordinal scale)
等级量表又叫次序量表或顺序量表,就是根据某一特点,将事物分成等级,并且用数字表示。这里的数字具有等级性或序列性,但没有等距性。
例如,对学生的思想品德进行评价时,可分为优、良、中、及格和不及格5个等级,相应地指派数字为:5、4、3、2、1。在此,数字5、4、3、2、1构成了5>4>3>2>1的位次关系,但并没有告诉我们各个数字之间的距离(或单位)相等。等级量表不具有等距性,因而也没有可加性。等级量表是一种比较低级的量表,它所能运用的统计方法有中位数、百分数、等级相关系数、肯德尔和谐系数以及秩次变差分析等。
3.等距量表(Interval scale)
等距量表也称为间距量表,是较类别量表和等级量表高级的量表。它除了具有上述两种量表的性质外,还要求每一单位量在整个量表的阶梯上都是相同的,但没有绝对的零点。例如,摄氏温度计就是一个典型的等距量表,在这一量表上的单位是等距的,但它的参照点是人为规定的(以冰点为参照点),而不是绝对零点,温度的绝对零点是-273℃。因此,我们只能对它做加减运算,不能做乘除运算。
心理学家和教育学家对等距量表产生兴趣的原因有如下几方面:第一,教育和心理测量中的许多结果都可转换为等距量表,而且,教育和心理测量中所要测量的人的成就和能力等,在客观上并没有绝对零点,这与等距量表的特征是相吻合的。第二,等距量表具有这样一个良好特征,即如果我们对等距量表上的每一观测值加减或乘除一个数,将不改变原来这些数值的关系。这样,在一个等距量表上得到的观测值可以转到另一个不同的等距量表上去,使我们可以对不同测量方式得到的结果进行比较。第三,等距量表能够最广泛地应用统计方法。如计算平均数、变异数、相关系数等统计量以及应用t检验、F检验等。
4.比率量表(Ratio scale)
比率量表又称等比量表,是这四种量表中最高水平的测量量表,也是科学家们的理想量表。它除了含有类别量表、等距量表和等级量表的特性外,还有一个具有实际意义的绝对零点。例如,长度、质量等都是比率量表。但在心理测量中,由于各种心理特征的绝对零点无法确定,所以心理测量中没有比率量表。比率量表所适用的统计方法,除了上面在等距量表上所述的内容外,还可用几何平均数和相对平均数等。
三、心理测量的特点与性质
(一)心理测量的特点
1.心理测量具有间接性
所谓间接性,也就是指心理测量是一种间接测量。科学发展到今天,我们还无法直接测量人的心理,只能测量人的外显行为,即我们只能通过测量人的行为反应来间接推论出人的心理特质。这里的特质是描述一组内部相关或内在联系的行为时所使用的术语,指的是在遗传与环境的影响下,个人对刺激做出反应的一种内在倾向。例如,一个人喜欢阅读物理学方面的书籍,喜欢仔细观察机器的结构,注意机器的运转,热心为别人修理钟表、自行车,同时喜欢拆东西,因此我们就可以推论这个人具有机械兴趣的特质。可见,特质乃是个体所特有的(与他人不同)、稳定的、独立的特征。但特质又比较抽象,它不是被直接测量到的有实体的个人特点。由于特质是从个体的行为模式中推论出来的,所以心理测量永远是间接的。
2.心理测量具有相对性
我们在判断某人的行为时,并没有绝对的、永恒的标准,有的只是一个连续的行为序列,只有把他的行为和别人的行为进行比较才能做出判断。因而,所谓测量就是看每个人处在此序列中什么位置上,由此测得的一个人智力的高低、兴趣的大小等都是与所在团体的大多数人的行为或某种人为确定的标准相比较而言的。例如,我们通过对某班学生的英语进行测量,认为某学生的英语水平较高,这种判断本身就是将他与班内其他同学相比较后得出的结论。因此说,这种推论是相对的。同时,由于每个同学都处在不断进步中,如果该生的进步速度低于班内其他同学,那么,经过一段时间再进行测验时,就不一定会得出该同学英语水平高的判断了。由此我们看出,从测量结果进行推论的相对性,其依据的标准并非一成不变。
3.心理测量具有稳定性
由于人们的行为都是由内部的心理特质控制的,而人的心理特质,无论是能力,还是人格特质都具有一定的稳定性,因而使人的前后行为具有内在一致的特性。这样测量所得到的结果就具有相当大的稳定性。正因为有这种特性,我们的测量结果才有意义。但个体又是发展的、变化的,个体不断地学习,不断地改造主观世界,不断地提高自我认识能力,所以,不同阶段的测量结果是会有一些变化的。由此也可以看到,测量的稳定性又是相对的。
4.心理测量具有客观性
无论是心理测量还是物理测量,客观性是基本的要求。由于在心理测量中要控制的变量比物理测量多得多,因而要做到客观并非易事。这里讲的客观性也就是测验的标准化问题。量具必须标准化,这是对一切测量的共同要求。经过长期的努力与探索,心理测验的标准化已经有了很大的改进。
心理测验的标准化,是指测验的编制、实施、记分、解释等程序的一致性。测验的编制要有一套严格的程序;测验结构的确定、测验项目的选择都必须有依据,并要经过预测,当项目难度、区分度和测验的信度、效度达到适当水平时才能使用;在测验实施过程中测验的条件要一致;测验器材要规范,如印刷材料要清楚,字体大小适中,操作用的器材物理性能稳定一致;测验的说明和主试的指导语要统一,主试不能有任何暗示;有严格的测验程序和时间限制;测验的记分要有详细统一的标准;测验的解释一般要依据常模。
所谓常模,是指一个测验在标准化样本上的分数分布。制定测验常模,首先要抽样,标准化样本是指对总体具有很好代表性的样本,一般通过分层随机抽样获得。抽样后对样本中的每一被试进行测验,最后统计测验结果,获得样组的分数分布资料,其中样本平均数和标准差是最重要的统计量,对测验结果的解释主要依据这两个统计量。
常模是根据具体人群测验结果统计而得的,而人是随着社会发展而变化的。作为解释依据的常模因而具有时效性,也就是常模资料随着时间的推延需要不断更新。一般10年左右就应当更新一次常模。
常模的使用也有一定的适用范围。这个适用范围主要根据常模样本的来源,即样本来自的总体。这需要考虑样本来自的地区、被试年龄、性别等。如果常模样本来自某个省(市),那么该常模只适用于这个省(市)。如果常模样本取自全国,则常模适用于全国。常模适用的年龄和性别也应该与样本中的被试年龄与性别一致。
标准化程度高的测验,其测量结果的客观性程度亦高。
(二)心理量表的性质
前面我们已经介绍了4种不同性质的量表,那么,心理测量到底属于哪一种水平的量表呢?心理量表根据其测量值的性质,一般来说,是属于等级量表,即心理测量的数据,只具有区分性和顺序性,而不具有等距性。我们知道,等级量表的数据是不可以进行加减运算的,但在实际使用中,心理测验的分数常常需要进行加减运算:因此心理测量学家常将心理量表看做等距量表来使用。将本质上是等级量表的心理量表当做等距量表来使用,必然会造成误差,因此我们在对测验结果解释时应该小心谨慎。当然,如果测验是精心编制的,测验结果呈单调变化趋势,那么这种误差是比较小的。有人做过这样的试验,在求相关系数时,将x用代替,计算结果与原来的只差0.05左右。测量学家还常常采用统计方法将测验分数转换成标准分数,这样可将等级量表转换成以标准差为单位的等距量表。