一、物理学习心理分析的内容、特点和方法
(一)物理学习心理分析的内容和特点
物理学习心理分析指对那些跟物理学习过程密切相关的心理现象的分析。这些心理现象包括物理学习的认知过程、物理学习能力、物理学习动机和兴趣等。另有一些心理现象如性格、气质、信念、世界观等,虽然也对物理学习过程有一定影响,但相对而言它们的影响不是太大,物理学习心理研究一般较少涉及。物理学习心理分析属于教育心理的研究内容,它跟其它教育心理分析如智力测验、能力倾向测验、学业成就测验等既有区别,又有联系。其相通之处在于,它们都是对学生心理的分析或测量,所测到的心理物质有重叠的部分,故一般来讲它们之间会有一定程度的相关,如物理能力测验成绩一般与智力测验、一般能力倾向测验以及物理学业成就测验存在正相关。但是物理学习心理测量又区别于智力测验、能力倾向测验以及学业成就测验。智力测验与一般能力倾向测验所测的是一般认识能力或一般能力倾向;学业成就测验或各种选拔考试(如高考),根据其测试目的,往往是对知识和部分能力的综合测试;物理学习心理分析则是对学生在学习物理过程中形成的、对进一步学习物理起决定作用的心理特质的分析或测量。
(二)物理学习心理分析的方法
物理学习心理分析是一种特殊的教育心理分析,其特殊性决定了这种分析必须是在学生的物理学习活动中,通过对学生的各种物理作业过程及结果的分析来探知学生的心理特质;同时由于它也是一种心理分析,可以借鉴一些一般心理测量的方法。
1.观察法
观察法是对研究对象在物理学习活动中的外部表现进行有目的、有计划的观察和记录,通过对观察结果的分析得出结论的方法。作观察记录可采用以下方法:①评等级法,即先将要观测的心理特质或行为排出不同等级,记录时在相应的等级上做标记;②记录出现频率法,即观察时出现一次特定现象即在表格中该现象处做一次标记;③连续记录法,即将观察到的现象用笔记、录音机、摄像机等手段记录下来以进行分析。
2.谈话法
谈话法即直接与被试学生进行有准备的谈话并记录谈话内容及被试学生的反应。运用谈话法要注意以下几点:①要有统一的谈话提纲,以确保对不同被试学生施以相同的刺激;②事先对被试学生可能的回答分类制表,谈话时只在相应的项目上作上标记;③建立和谐的谈话气氛,消除被试者的拘束和戒备心理,使之畅所欲言。
3.作品分析法
作品分析法指通过分析学生的作品而推断其心理的方法。如通过对学生作业中常犯错误的分析可以推断学生学习中的心理障碍、知识缺陷或不良习惯等;对某一类学生作业的长期分析则有助于推断该类学生的心理特点等。
4.问卷法
问卷法是通过问卷形式对学生的学习心理进行调查的方法。运用问卷法可以对学生的一些非智力因素如动机、兴趣等进行调查。
应用问卷法要注意以下两点:①设法打消被试者的疑虑和戒备心理,问卷一般不要求署名;②项目的提问方式不应带有任何倾向性,而且要使回答方式尽量简单。
5.测验法
测验法是通过心理测验对学生的物理学习心理进行测量的方法。运用测验法可以对学生的物理学习心理作大规模的测量,是研究学生的物理学习心理特别是物理学习能力的有效手段。但为确保测量结果的有效性和可靠性,该法对整个测量过程特别是测验的编制有严格要求。
①运用测验法的基本要求
a.客观性。为了减少测量误差,测验始终应注意客观性,不可掺杂个人的主观意见,测验要标准化并有详细评分标准,采用统一答案纸进行测验。
b.取样。指从整体中随机取出样本,包括对被试者的取样和测题材料的取样,只有抽取的样本能真正代表整体时,测量结果才会具有普遍意义。
c.测验的质量要可靠。测验的质量一般指测验的信度、效度要高,测题的区分度要好。
d.标准化与常模。标准化是指测验的编制、施行、计分和解释都要按规定的法则进行。标准化测验要求测验的项目要符合规范,施测时要以同样的项目向所有被试者施测,对全体被试者使用同一说明书和指导语,用相同的测试时间,评分标准应预先制定,解释结果时不应受测验者态度、情绪的影响。
标准化测验要求建立常模,作为比较不同受试者水平的依据。所谓常模,是指标准化样本在测验中的平均成绩。常模可有多种,如智力测验中的智龄、智商,在能力测验中常模也可用百分等级或标准分数。
②物理学习心理测验编制程序
a.确立测验目的。编制测验时,首先要确立测验目的,是测一般物理学习能力,还是某种特定的物理学习能力,或其它心理特征;是用来描述、评价、选拔,还是诊断个体心理差异;是团体测验还是个别测验。另外还要了解被试者的年龄、生活背景、文化程度等信息。
b.选择测验材料编选测验题。测验材料的选择直接关系到测验结果的有效性,应非常慎重。对一项合适的物理学习心理测验材料,有以下要求:第一,以物理知识为载体,取材要全面,应能涵盖所测心理特质的范围;第二,问题情境对学生来说应是新的,且有一定难度,以免学生仅凭对类似情境的记忆来答题而影响测量的准确性;第三,材料要突出所测的心理特征,排除干扰因素;第四,材料应适合被试者的年龄特征和文化水平;第五,材料应对所有被试者具有普适性。
编制测验题是一项十分复杂的工作,要综合考虑测验目的、材料的性质、被试者特点以及施测时的各种实际因素。编制的测验题数量应比最后所需的测验题数量多出一倍或几倍,以备筛选和复份。
c.预试。预试是将初步筛选的题目综合成一个或几个测验,并向同一组人员施测,以获取有关测验题性能的客观资料。预试时应注意预试对象要有代表性,人数以三四百为宜,测试环境应与正式测试时相同,记录被试者答每题花费的时间。
d.进行项目分析。项目分析指对每道题的质量分析,包括分析测题的难度、区分度以及吸引度。目的是淘汰不适当的测题,使题目趋于标准化。
区分度分析,包括题目内在一致性分析和效度分析,前者考查每题与整个测验性能是否一致,后者鉴定每道测验题能否测出要测的东西。
吸引度分析,分析备择答案的吸引程度,若各备择答案吸引被试者的程度相当,则为好的题目,若有一两个答案很少有人选,
则要修改或淘汰该题。
e.编排试题,编写说明书和指导语。最好的试题编排方式是由易到难循环排列,如每10题为1组,从易到难循环编排。
说明书是作为主试者的工作工具和对被试者的提示,一般包括说明测验目的,实施方法,记分方法,结果处理等。
指导语是指示被试者测验时的注意事项。通过监测人宣布或附于卷面上,包括简要说明测验目的,对被试者的要求等。
f.制定标准答案规定测验时间及记分方法。标准答案及记分方法应在编制测验时同时编制出来。规定测验时间,包括主试者
宣布说明所需时间及被试者解答的时间。
③物理学习心理测验的质量评定
a.效度。测验的效度指测量结果的正确性、有效性,即该测验能够测出所要测量的心理特质的程度。效度是测验的最重要的质量指标。
b.信度。信度指测验得分的稳定性、可靠性,或者说,对同一被试者的前后两次测验,所得结果是否一致?测量结果是否可靠?信度是个统计学概念,可用相关系数表示,称为信度系数。
二、物理学习能力的测量
(一)物理学习能力及其结构
物理学习能力是学生在接受学校教育和参与社会实践过程中所形成的诸多能力中的一种,是在物理学习和物理活动中"逐渐形成的一种调节物理活动的相对稳定的个性心理特征。
物理学习能力不是单一的能力,而是由多种能力构成的。物理学习能力的划分根据分析的着眼点不同而不同,一般来讲可以从以下两种角度对物理学习能力进行划分:
从物理学习能力是在物理活动中进一步发展了的认识能力(智力)这一角度看,物理学习能力应包括观察能力、实验能力、物理思维能力、物理想象能力和物理记忆能力等。
物理学习能力是在物理活动中发展起来的,若从调节各种物理活动过程的心理结构这一角度看,物理学习能力可分为观察能力、实验能力、运用物理知识分析解决问题的能力、物理自学能力和创造能力。
各种具体物理能力的构成或评价指标如下:
1.物理观察能力
①目的性;②条理性;③理解性;④敏锐性;⑤持久性。
2.物理实验能力
①设计实验;②实验操作;③观察和记录;④分析解决实验中的问题;⑤数据处理;⑥分析总结。
3.物理思维
①物理抽象;②物理概括;③物理判断、推理;④物理综合分析;⑤运用数学处理物理问题。
4.物理想象能力
①建立空间位置关系;②形成物理图景;③想象物理过程;④想象操作。
5.分析解决物理问题的能力
①分析物理问题的一般智力;②物理想象;③物理抽象思维;④运用数学解决物理问题;⑤发散思维。
6.物理自学
①对物理文字材料的领会;②发现问题提出问题;③物理实验和理想实验;④观察;⑤运用知识;⑥资料检索与使用;⑦对学习活动的自我意识及监控。
(二)物理学习能力测验题的编制
物理学习能力的测量可通过前面介绍的心理测验程序进行,其中核心的工作是编制测验题。编制测验题时首先要明确测验目的,是测量一般的物理学习能力,还是测量某个特殊的物理学习能力,并明确对要测的能力构成是如何界定的。其次,题目的编选要符合前面提出的原则。下面是几个物理学习能力测验题的例子:
[测验题1·物理实验观察]
导语:注意以下演示过程,记下你所看到的所有现象。
演示:在玻璃水缸中放适量带有颜色的水,水中放置一根高于水面的蜡烛,点燃蜡烛,然后用广口瓶将燃烧着的蜡烛全部罩住
(瓶口浸入水中)。
本题测验观察的敏锐性。如果被试者在看到蜡烛熄灭时也观察到了罩内水面的轻微上升,则敏锐性计1分,否则不计分。
[测验题2·自然观察]
组织学生观察雨后彩虹,观察前先讲清彩虹的成因,然后让学生去实际观察,以验证解释的科学性。要求对彩虹的形状、颜色以
及产生的条件进行仔细观察,并作好记录。回来后测试观察结果:
①请尽可能详细地描述出你所见到的彩虹的所有特征。
②当彩虹出现时,你看见太阳在什么方向!
本题可测观察的条理性和理解性。如果被试者能完整地答出彩虹的形状、颜色构成及其排列顺序,则记条理性1分,否则不计分。
如果被试者正确答出太阳在观察者的后上方,则理解性计1分。
〔测验题3·思维能力〕
指出下列四种情况中,那些可以将物体看作质点?A.在高处由静止释放一根形状不规则的短木棒,木棒翻滚着落地,计算落地时间;B.研究炮弹在炮膛中旋转加速的过程;C.研究汽车突然启动时乘客的运动;D.研究电梯中电梯对人的支持力。
如果答案完整、准确,则物理抽象能力计1分,否则不计分。
三、物理学习动机和学习兴趣的分析
(一)学习动机与学习兴趣
学习动机是推动主体进行学习活动的内在动力机制。学习动机由两个基本部分组成,一部分即作为个性心理倾向的学习需要,是潜在的学习动机;另一部分是学习期待或学习诱因,其作用是激发学习需要,使动机由潜在状态转化为激活状态,从而发动和维持学习活动。
学习需要一般认为由三种成份构成,即认知需要、交往需要和自我提高需要。物理学习动机中,如有的同学感到“物理课生动有趣,并能不断揭开事物的秘密,所以很爱学。”这是认知需要的反映。有学生说:“物理老师和霭可亲,风趣幽默,对我们很好,所以爱学物理”;还有学生说:“我们班别的同学物理都很好,就我们几个学得不好,所以我也得加劲学”等则体现了学生的交往需要。还有学生立志要考名牌大学理工科,或为将来去研究所工作而学物理等则反映了学生自我提高的需要。
学习兴趣是人积极探究事物的认识倾向,是认识需要的情绪表现。中学生学习物理的兴趣大致可分为四种发展水平,依次是直觉兴趣、操作性兴趣、因果关系兴趣和概括性认识兴趣。兴趣的发展水平与年龄有关,但起决定作用的还是在学习过程中的不断培养。学生在学习物理过程中认识需要不断满足,促进兴趣水平不断提高,并使物理学习兴趣日益分化和稳定。
(二)物理学习动机和学习兴趣的分析
物理学习动机、兴趣的分析可采用谈话法和观察法,对于大规模的研究一般用问卷法。
使用问卷法首先要编制问卷,一般来讲,问卷的项目可采用以下几种形式:
1.自由记述形式例如调查学生对物理课的兴趣时,可直接问:你是否喜欢物理(实验课,习题课……)?请把你的理由写出来。
()因为物理知识在生产和生活中有用。
()因为学校开设了这门课。
()因为升学要考物理。
()因为我从学习物理中得到快乐。
……
3.选择形式例如:你为什么要学物理?如果你的原因是下列的某一条或某几条请将其标号写下来。A.内容有趣;B.能做实验;C.生活中有用;D.升学考试有用;E.教师讲得好;F.老师对我好;G.容易学会;H.家长要求;I.有课外活动……
四、物理学习心理过程的分析
物理学习心理过程分析可从以下两个方面进行:一是结合物理教学实际对物理教学过程中物理学习心理的作用特点及发展规律进行分析、探讨,例如前一段时间探讨较多的“初二物理学习的分化”、“高一物理学习的台阶”等问题即属此类;另一方面是对物理学习过程中心理障碍的分析,限于篇幅以下仅就后者作简要介绍。
(一)物理学习中思维障碍的分析
思维是物理学习过程中最主要的心理活动,也是存在障碍最多的心理活动。思维障碍干扰和阻碍物理思维活动的正常进行,影响学生对物理知识的正确理解,久而久之,势必会影响物理学习能力甚至一些非智力因素的正常发展。造成思维障碍的因素很多,一般可归为三类:一类是知识因素,即由于学生头脑中缺乏为思维活动定向的知识或有关知识处于混乱无序状态而形成思维障碍。如在建立物理概念的思维过程中,如果相应的表象知识缺乏或错误,存在错误的前概念或新旧概念界限不清,则都有可能发生思维障碍,形成对物理概念的表面理解或引起概念的混淆。在解决物理问题的思维过程中,如果学生对相应的物理概念、规律的含义或适用范围不清楚,则这一思维过程必然会遇到障碍。再一类是技能或能力因素,即缺乏执行思维活动的智力技能或能力从而使思维过程无法继续。例如综合性强的物理问题要求学生具备较强的综合分析能力,灵活性强的物理问题要求学生具备逆向思维、发散思维能力,即使是基本的物理问题也要求学生具备分析物理问题的基本智力技能,否则解决物理问题的思维活动会障碍重重,无法顺利进行。最后一类是学生的不良思维习惯和一些外来干扰因素。如中学生思维的绝对化、片面化倾向,想当然的思维习惯以及思维定势的影响都可形成思维障碍;教师在讲课或演示实验过程中,处理不当也会产生一些干扰因素,导致思维障碍。
思维障碍的分析比较复杂,不象能力可以通过测验测出,也不像动机可通过问卷调查。思维障碍存在于学生的思维过程中,间接反映在学生的智力作业中,学生自身也不一"定能意识到,因而既不能通过外部观察和学生内省报告直接得到,也不能在学生的作业中直接测出。对思维障碍的分析只能综合运用观察法、谈话法和测试法(或作业分析)通过对学生思维过程及结果的深入综合分析方可得出结论。具体分析时可采用以下步骤:
1.提出问题通过对教材中重点、难点的分析和物理学习中各种思维过程的分析,确立一些学生学习中可能出现困难的知识点。该步工作也可以通过整理平时对学生学习过程的观察和对学生作业的分析所积累的资料来完成。
2.测试针对这些疑点、难点编制测验题,测试时不仅要求学生答出结果,还要写出理由,以充分暴露思维过程。
3.深入了解根据学生回答问题的情况,选择部分学生,运用谈话法进行进一步诊断。
4.做出结论,并提出教学对策。
(二)物理学习中非认知心理障碍分析
关键词:内隐联想测验;内隐态度;消费者行为
分类号:B849;C93;B841
1、内隐联想测验概述
研究者应用外显测量方法直接询问消费者对产品、品牌的态度,然而一些特殊情境下,被试的自陈报告很难提供准确的态度信息。Rosenthal和Rosnow(1991)发现回答者倾向于表现得有礼貌和尊敬调查者,往往会揣测调查者意图,作出“迎合”调查者的回答。即使被试愿意表达他们的真实态度,也可能有心无力,因为他们常常无法意识到潜在的动机、愿望、价值观和态度(Wilson,Hodges,&LaFleur,1995)。
为弥补外显测量的不足,研究者开始关注内隐测量方法,Greenwald,McGhee和Schwartz(1998)年提出了内隐联想测验(ImplicitAssociationTest,简称IAT)。IAT以反应时为基础,通过计算机呈现的分类任务测量两概念间自动化关联的容易程度,间接获取个体的态度信息,包括不愿意表达出来的态度、不完全态度(由于信息提取偏差造成的态度改变)以及内隐态度(个体无法意识到的态度信息)(Brunel,Tieriej&Greenwald,2004)。
IAT中有两组概念词(如名牌、山寨品牌,即研究对象)和两组属性词(如喜爱、厌恶),基本过程是呈现一属性词(attributiveword),被试快速按键反应,将属性词归于某一概念词(conceptword)。概念词与属性词之间存在两种关系:相容的(compatible)(假设为名牌一喜爱,山寨.厌恶)和不相容的(incompatible)(假设为名牌,厌恶,山寨.喜爱)。IAT假设当被试将相容的两组词归类时,更多地基于自动化加工,因此反应时较短;反之则需要意识参与,导致反应时延长。两反应时之差即代表被试对研究对象的态度:相对于山寨品牌,被试更偏爱名牌。IAT的施测全部通过计算机完成,具体的实验流程和数据分析可参阅Greenwald等人(1998)、蔡华俭(2003)、崔丽娟和张高产(2004)等文章,本文不再详细介绍。
作为广泛应用于社会心理学领域的内隐态度测量工具(张珂,张大均,2009),IAT也已经在消费心理学领域得到应用和实证检验(Bruneletal.2004),只是对IAT在后一领域的研究状况,目前尚未得到系统的梳理。本文将综合近几年的研究文献,依次介绍IAT在消费研究领域的应用价值、应用范围、信效度情况、缺陷及发展变式,为研究者提供具有参考价值的总结回顾,以及一些有价值的前瞻思考。
2、IAT在消费心理研究中的应用价值与应用范围
在消费认知研究中,IAT通常应用于3种情境:一是消费者会有意调整外显反应时,即被试的反应会受到印象管理效应等影响;二是当涉及消费者无法意识到的内隐认知时,即由于缺乏内省能力,消费者无法提取存于记忆中的态度等信息;三是在研究内隐态度对消费者行为的预测关系时(Dimoftc,2010):
2.1应用IAT避免消费者反应偏差
消费者反应偏差来自于两方面:一是被试受社会赞许效应、印象管理影响对反应进行有意调整;二是信息提取偏差造成的态度偏差(Wilsonetal.,1995)。
一方面,由于消费环境下存在着诸多的社会准则,一些消费行为和态度并不总是被社会所接受和认可的,人们在表达态度、做出行为时,往往会受到印象管理效应的影响。例如,对消费者进行废物循环利用的行为和态度调查,极可能发生这样的情况:由于社会压力,被调查者被迫遵循社会所能接受的观点和行为准则对调查做出反应,不愿表达他们实际上的对废物循环利用的一些不满,不愿承认日常生活中没有做到废物循环利用的现实,这样就会误导调查结果。
印象管理效应往往与刻板印象关联。Brunel等人(2004)发现广告代言人的种族会影响被试对广告的态度。研究选取分别由白人运动员和黑人运动员代言的运动品牌广告,对被试进行问卷测量和IAT施测。问卷调查结果并没有发现被试偏爱白人运动员代言的广告,但在IAT结果中,被试表现出对白人代言的广告的明显偏好,外显和内隐测量的结果出现分离,外显测量中被试受到印象管理效应的影响。
另一方面,信息提取过程的不完全性可能会导致态度改变。Wilson等人(1995)认为,在思考持有某种态度的原因时,人们会关注并提取可达的、合情理的、易于用语言表达的信息,忽略意识不到的、很难用语言描述的信息,最终导致最初态度的改变。在问卷调查中,被试往往要以这种方式“产生”或者“提取”态度,例如要求被试思考从未考虑过的东西(例如对某广告的态度),被试理所当然采取上述有偏差的态度信息提取策略,这是外显测量不可避免的缺陷。但是IAT测量中,被试做的是对词组快速分类,限制了信息提取过程,进而避免片面信息对态度的影响(Greenwaldetal.,1998)。
有研究者认为IAT任务也会对态度本身造成影响。Ebert,Steffens,yonSttilpnagel和Jelenec(2009)以两种糖果品牌为实验材料,通过IAT任务,使被试将品牌A与积极属性词进行关联学习(同时将品牌B与消极属性词进行关联),最终发现IAT会在一定程度上改变消费者态度。然而关联性学习对于态度改变是否会对研究结果和实际应用造成显著影响,有待考量。
2.2应用IAT测量消费者内隐认知
消费者内隐认知在这里包括两个方面:一是内隐态度,即应用LAT测量消费者对产品、品牌、广告的内隐态度,例如Martin,Lee和Lacey(2011)应用IAT探讨原产国效应对品牌态度的影响,与外显测量作对比研究;二是与消费者心理相关的其他内隐认知过程,例如品牌口号多义性的内隐认知(Dimoue&Yalch,2007)、声音频率与味道的内隐关联(crisinel&Spence,2010)等。
在对内隐态度的测量方面,IAT主要应用于品牌态度和广告态度的测量。
1)品牌态度。品牌态度与消费者自我概念有紧密联系。Greenwald等人(2002)认为,自我与品牌形成内隐联结后,品牌与属性词就共享了“自我”这个第一层级链接(first-orderlink),品牌与属性词之间的关联被加强,从而促进个体对品牌形成较为积极的态度。根据该理论,Perkins和Forehand(2012)探讨了内隐自我概念与品牌的联结对品牌态度的影响。研究者虚构了两组汽车品牌,通过自主分类任务(类似于1AT的组合分类任务),使得被试将两组品牌与“自我”“他人”两组概念词进行联结,最后测量内隐品牌态度以及外显品牌态度和购买意图,结果发现被试偏好与“自我”关联的汽车品牌。
品牌态度还涉及到文化差异和社会因素,一个典型的例子是品牌来源国(countryoforigin)效应。该效应是指消费者基于产品产地/品牌所属国对产品本身的质量等作出评估,从而影响态度和购买意向的现象,但消费者往往无法察觉品牌来源国效应的存在。Dimofle,Johansson和Ronkainen(2008)的研究关注美国消费者对全球品牌的态度,问卷调查中美国消费者并没有表现出对全球性品牌的偏好,但这种偏好却在IAT中表现出来,相对于本地品牌,美国消费者跟发展中国家的消费者一样,偏好跨国品牌。Schooler(1965)发现,相比较发展中国家的产品,来自发达国家的产品更加受欢迎。之后的研究发现来源国效应受到来源国属性、产品属性和消费者因素三方面的影响。
同样地,Shi,Wen和Fan(2012)等人通过IAT和问卷调查的方法研究中国消费者的来源国效应。研究发现中国人的面子心理影响消费者对日本、美国以及本国产品的外显态度,并调节了外显态度和内隐态度之间的关系。相比较面子心理较轻(lowfaceperception)的个体,面子心理较重(highfaceperception)的被试对日本和美国品牌(相比较国内品牌)表现出明显的外显偏好,且外显态度和内隐态度呈现出较高的不一致性。类似的研究还有黄韫慧和施俊琦(2011)等。
2)广告态度。IAT广泛应用在广告态度的测量中,Forehand和Perkins(2005)研究广告名人声音效应,IAT结果表明,当不知道广告声音来源是名人时,被试表现出对广告的内隐偏好;一旦告知声音来源,他们会自动调整自身认知,内隐偏好消失。然而外显测量中被试前后态度没有明显变化。广告态度的研究牵涉到品牌态度,袁登华、罗嗣明、付春江和谢应勤(2010)整合了广告和品牌研究,通过IAT探索广告干预对消费者品牌态度和信任的影响。
除了利用IAT获取品牌、广告态度,研究者也把IAT灵活应用到具体消费心理现象的研究中。Dimofle和Yalch(2007)认为品牌口号多义性会传达给消费者关于品牌的不同信息,对品牌口号可能存在的多义性进行了探索。研究选取具有消极第二层意义的品牌口号,分别测量被试的外显态度和内隐态度,发现品牌口号多义性不影响外显态度,而IAT结果表明具有较高能力获取多义性的被试会受到品牌消极意义的影响。品牌口号多义性对态度的影响是自动发生、不受意识控制的,因而外显测量没有测查出来,IAT却可以将这种自动化过程记录下来。Crisinel和Spence(2010)应用IAT探索声音频率与味道之间是否存在概念联结关系。他们选取了高频声音和低频声音作为刺激词组,分别与甜、酸、苦、咸4种味道的食品进行IAT分类任务。实验结果表明甜味和酸味与高频声音之间确实存在概念联结,而咸昧和苦味并没有表现出跟低频声音的联结。从此例中也可以看出,IAT实验材料的选择很灵活,既可以是词语、图像,也可以是声音等其他媒介。
2.3应用IAT预测消费者行为
研究表明,内隐态度在预测不受意识控制的自动化行为时更为有效,而外显态度可以较好地预测深思型的受意识控制的行为(Wilsonetal.,1995;Perugini,2005)。
时间压力被认为是调节内隐态度和外显态度对行为预测效果的重要因素。Friese。Wanke和Plessner(2006)分别测量了被试对一般食品和品牌食品的内隐态度(IAT)和外显态度(问卷),接着让被试在有时间压力(5秒)和无时间压力(充足时间)两种条件下进行产品选择。当内隐态度和外显态度一致时,无论有无时间压力,80%以上被试的选择行为同其态度一致;对于内隐和外显态度不一致的被试,当有足够时间考虑选择时,他们的选择更多地与外显测量结果一致,达到90%;一旦限制了选择时间,一致性则只有38%,说明在时间压力下被试更倾向于内隐态度。
该研究表明,IAT和外显测量均能够有效预测行为,但与具体情境有关。如果被试有足够时间去考虑自己的选择,他们的行为会与外显报告的情况一致;当消费者缺少时间提取外显偏好信息时,内隐偏好成为有效预测指标,因为时间压力阻止了信息提取和认知判断过程,时间压力下的行为更倾向于被高度可达的偏好信息所指引。
关于IAT对消费者行为预测能力的研究,多数与Friese等人的研究类似,着重比较IAT与外显测量的预测能力在不同情境设置下的差异,二者预测能力的具体差异将在下一部分详细介绍。
3、消费心理研究中IAT的信度和效度
Maison,Greenwald和Bruin(2004)的研究为IAT在消费心理研究的应用提供了实证证据,但局限于特定的研究课题,就整个消费研究领域来讲,IAT的适用和有效性情况如何呢?Brunel等(2004)对内隐测量方法应用于心理测量的要求作了总结,认为内隐测量方法必须同时满足以下4方面的标准:首先,内隐测量结果需达到较高的信度、效度等心理测量指标;第二,内隐测量方法对个体差异的敏感性在心理学研究中也是十分重要的;第三,必须能很好地隐藏测量目的,避免印象管理效应和社会赞许效应对测量结果的影响;最后,不受被试态度信息的可达性限制,可以探查被试通过内省无法获知的态度信息。根据上述标准,我们对IAT在消费心理研究中的信效度进行了阐述和评价。
3.1IAT的信度和情境敏感性
Greenwald等人(2002)的研究中对IAT应用研究文献结果进行了元分析,发现IAT的重测信度平均为0.60,这与Bosson,Swarm和Pennebaker(2000)的研究一致。
Greenwald和Nosek(2001)发现IAT结果不会或较少受到以下实验程序设置的影响:左右手与正性词负性词的配搭;每组分类中所含项目数量多少;每组分类中所含项目的熟悉度;每次反应后到下次刺激呈现的时间间隔;分类任务顺序(需要设置顺序平衡以避免此效应);对错误反应和非正态反应时间分布的处理方式。Nosek(2005)对IAT测量的结构效度讨论中还认为,IAT每个部分的任务数量设置并不会对结果产生显著影响。
IAT对实验程序的许多设置具有一定的免疫力,这对信度的保证是有利的,然而IAT测量的确也会受到某些情境设置的影响(侯珂,邹泓,张秋凌,2004)。Dasgupta,McGhee,Greenwald和Banaji(2000)发现,给被试呈现被歧视组中杰出人物的照片,以及非歧视组中反面人物的照片,被试对被歧视组的消极内隐态度会降低。该研究表明IAT结果会受到某些具体情境的影响,而IAT对情境的敏感特质有待进一步研究和解释。为了保证足够的信度,对心理测量工具通常要求能够尽量避免外界情境变量对测量结果的影响,但与此同时,研究者也常常会根据研究设计的需要加入一些环境变量作为自变量,他们希望IAT对情境具备一定的敏感性,以达到实验条件的成功操纵。从这个方面讲,IAT的这个特质可以加以应用。
3.2IAT的效度和预测能力
近年来的研究表明,IAT的确可以很好地预测消费者行为。Forehand等(2005)发现,自我概念与品牌联结的IAT测量结果能够很好地预测品牌偏好、购买意向以及感知品牌优越性,这些预测关系受到个体对品牌内隐态度的调节。
很多研究关注外显测量和内隐测量对行为意图和实际行为的预测能力上的差异。Greenwald,Poehlman,Uhlmann和Banaji(2009)就以往应用IAT的研究(其中包括12篇消费心理研究)的预测效度进行了多元分析,发现IAT和外显测量结果之间存在良好相关性,特别是在品牌偏好和选择研究中。
一些实证研究甚至提出内隐测量比外显测量具有更好的消费者行为预测效度,例如Brunel等人(2004)发现内隐测量方法比外显测量更能有效预测品牌识别和偏好,产品使用等;Friese,Hoffman和Wanke(2008)对消费者食物购买选择情境下的研究表明,内隐测量(IAT)结果比外显测量更能准确地预测其冲动消费行为。此外,Maison等(2004)在对IAT预测效度的讨论中认为,即使在不存在印象管理效应和态度可达性(accessibility)问题的情况下,IAT测得的内隐态度也比外显态度更能有效地解释消费者行为。
实际上,当研究不涉及刻板印象、种族态度等易受社会赞许性影响的课题时,IAT与外显测量结果之间往往存在很高的相关性(Nosek,Banaji,&Greenwald,2002)。虽然IAT和自我报告式的外显测量方法所测量的心理建构有区别,但同时又存在关联(Greenwald&Famham,2000)。这种分离产生的原因主要有二:一是反应偏向因素,即由于问题比较敏感导致个体进行印象管理,从而提供了不准确的回答;第二是内省因素,比如个体由于缺乏内省态度的能力或者没有进行充分的态度认知加工,造成外显测量结果不够准确和真实。
由于采用反应时方法,计时精确到毫秒,IAT易受某些情境设置的影响,而且有研究者发现这种情境敏感性还会影响到IAT对行为(意向)的预测力。在Wanke,Plessner和Friese(2002)的研究中,他们发现了时间限制对预测力的影响。在时间限制下,个体的品牌偏好主要与内隐测量结果相关;而当个体有较充足的时间时,外显测量结果表现出较好的预测。Friese等(2006)进一步对时间压力与用户产品选择的关系进行了研究,实验要求被试在可循环和不可循环的书写板之间做出选择,当被试被要求在5秒钟内做出选择时,用户对不同书写板的内隐态度可以较好预测其选择。以上研究表明,当消费者的认知资源被限定时,他们的选择和行为会更多地依赖于记忆中的内隐联结。
类似的发现还有Friese等人(2006)对情境和品牌选择关系的研究。当给予被试充足的时间考虑选择时,被试的选择完全由外显测量结果预测出来,不论外显测量结果与内隐测量是否一致;但是当限定被试选择时间时,且内外态度不一致时,被试的选择极少与其外显态度一致。
总体而言,作为内隐的心理测量工具,IAT具备良好的内部一致性信度,其结果不易受到IAT任务设置细节(如刺激呈现的时间间隔)的影响,但实验环境有可能会对IAT结果造成影响,这种情境敏感性是研究者应用IAT时需要注意的。效度方面,比较一致的结果是,在不涉及印象管理和刻板印象时,IAT和外显测量结果之间具有较高相关,并都能较好地预测行为;同时,IAT对较少受意识控制的行为具有更好的预测能力和解释度。IAT和外显测量结果也会因信息提取偏差或反应偏向而出现分离,这也证明IAT应用的必要性。IAT的预测效度容易受到某些实验条件的影响,比如时间压力,说明IAT的应用是有条件限制的。最后,IAT与外显测量结合被证明能够更好地预测行为。
4、内隐联想测验的缺陷及其发展变式
4.1IAT结果的相对性与SC-IAT
IAT作为有效的间接测量工具在心理学研究中得到广泛应用,但同时受到一些质疑。IAT存在两个主要缺陷,其一是IAT结果的相对性。经典IAT所测量的是相对关联强度,其结果只能做相对性的解释。以可口可乐和普通可乐为例,只能说较之于普通可乐,被试对可口可乐的态度较积极,而不能定论被试对可口可乐持有积极的态度,因为实验数据并没有表明被试对普通可乐的态度是积极的,中立的,还是消极的。
针对结果相对性缺陷,Karpinski和Steinman(2006)提出单类内隐联想测验(SingleCategoryIAT,简称SC-IAT),并将其应用于品牌态度研究。相比较经典IAT,SC-IAT更加简单,IAT中的两组概念词在SC-IAT中变为一组,其他的实验设置和流程与IAT类似。以品牌态度研究为例,SC-IAT的组合分类任务也包括两个,在第一阶段的组合分类任务中,被试需要对服装品牌“Gap”和“Good”属性词进行同一按键反应,而对“Bad”属性词进行另一按键反应:在第二阶段进行反转的组合分类任务。
将SC-IAT的反应时数据作对数转换后进行IAT效应的计算。由于SC-IAT中将唯一的概念词(品牌“Gap”)分别与两极的属性词组进行组合分类任务,并计算反应时之差,而免除了经典IAT中两类概念词组的比较所造成的结果相对性。也就是说,SC-IAT的结果是明确的,非好即坏,而不是去判断相对性的积极和消极态度。在此研究中,SC-IAT表现出较好的内部一致性信度(ct=0.65),SC-IAT结果与外显测量结果之间没有发现显著相关,但二者在预测未来行为时出现交互作用。
4.2IAT结果的单一性与MD-IAT
内隐联想测验的第二个主要缺陷是结果解释的单一性。虽然IAT中可以设置若干属性词刺激,但在数据分析时不能将这些刺激物划为独立维度进行解释,因此每个IAT结果其实只有一个维度、两个水平。对于某些复杂的研究对象,研究者可能想探查很多方面的态度信息,一个解决方法是进行多次实验,Gattol,SaaiksiarVi和Carbon(2011)称之为多维度内隐联想测验。它实际上就是多个IAT的组合,每个IAT测量态度的一个维度,最后就可以得到对某对象的更综合全面的态度。
多维度内隐联想测验要求被试进行多组IAT任务,这就需要考虑练习效应的问题。以往的IAT研究表明,先前IAT经验会使后来IAT任务的效应减弱,但仅在被试做过不多于两次IAT实验任务的情况下是这样(Greenwald&Nosek,2001):当被试有超过两次IAT任务操作经验时,并没有发现更进一步的效应减弱情况(Greenwald,Nosek,&Banaji,2003)。因此,在多维度内隐联想测验中,练习效应问题并不显著,适当的平衡设计也可以很好地避免这个问题。
MD-IAT相对于传统的IAT测量,其优势在于可以对消费者态度进行更细节化的测量和探查。以品牌态度为例,通过MD-IAT,研究者能够很容易获取多层面的态度信息,从而勾勒出被试内心较丰富的品牌形象。在Gattol等人(2011)的实验中,研究者测量了被试对3个汽车品牌(奥迪、福特和宝马)的6个维度的态度,每个被试需要在3天时间里进行3组共18个IAT任务,每组的6个IAT任务分别针对想要测量的6个态度维度(例如,安全性、可信赖性)进行测量。
从实验结果看,MD-IAT表现出较好的信度(分半信度为0.79)。该实验为了测查MD-IAT的外部效度,加入了“品牌线索”自变量,实验结果未发现其主效应,表明多维度内隐联想测验较少受到刺激样例特性的影响。这为MD-IAT结果的可依赖性提供了部分证据,但同时也告诉研究者,MD-IAT并不适合测查外部刺激效应(比如具体的产品设计等1。
以上仅列举两例,试图对IAT的缺点和近来实验设计的发展进行初步介绍,内隐联想测验的缺陷不止于此。研究者也一直致力于将IAT更好地应用于消费心理学研究(李西营,王晓丽,赵玉焕,徐青林,2011)。比如,Nosek和Banaji(2001)提出的GNAT(Go/No-goIAT),吸取了信号检测论的思想,是对IAT方法很好的改进,类似于单类内隐联想测验(sC-IAT),适用于对单一对象进行态度测量,其在消费心理学中也有很广泛的应用前景。
5、小结与展望
本文对IAT在消费心理研究中的应用价值、范围、信效度、局限和缺陷等进行了论述,希望能够为研究者解答文章引言部分提出的几个疑问,更好地应用IAT探索消费者心理。IAT的应用范围一直在扩大延伸,就IAT在本领域的应用前景和发展趋势来看,笔者认为以下几点是比较突出的:
1)将IAT应用于消费心理相关的刻板印象研究(王沛,孙连荣,2007;邹庆宇,姜月,2006)。IAT较少受到被试印象管理的影响,一直被应用于与刻板印象相关的研究,今后研究中可以应用IAT深入探析与消费心理有关的刻板印象。例如,Brunel等(20041应用IAT对广告代言人种族效应进行的研究,获得广告和品牌态度中也存在种族刻板印象的证据,并印证了以往社会心理学中的群体自我贬低和系统公正化等理论。朱虹、张科和黄韫慧(2011应用IAT探索性别、积极情景线索与消费者对“直销”刻板印象的关系,研究探讨了中国消费者对整个直销行业不信任的刻板印象,并证实了积极情景线索可以起到降低刻板印象的作用。
2)利用IAT重新探索诸如广告态度形成、简单暴露效应、经典条件作用等消费心理过程和现象。IAT对概念间内隐联结的直接探测能够给研究者提供最直接的数据证据。正如Horcaio,Brifio和Petty(2010)利用IAT对说服和态度改变所做的探索,从态度自动化加工的角度证明了说服信息对内隐态度的影响,以及这种效应对自我概念、自我与产品联结的扩散影响。
3)将经典心理学理论与IAT进行结合,发展完善消费者心理研究方法和测量工具。例如,Greenwald等人(2002)基于认知协调理论并结合IAT的设计思想,提出了“内隐态度、刻板印象、自尊和自我概念统合理论”,验证了消费者态度和自我概念之间存在联结关系。该理论框架把自我概念与消费者态度结合起来,较之于单纯的态度测量更加深入和整合,之后该框架被应用于品牌态度测量中(Perkins&Forehand,2012)。
4)将IAT应用于消费者健康心理研究。在食品消费行为中,消费者始终面临着双重抉择:健康,还是美味。在具体情境里的消费行为背后,究竟是那一方起主导作用?为何人们在食品选择时往往言行不一?其决定因素是什么?如何促进消费者进行健康地食品消费行为?要回答这些问题,研究者仍然要解决外显态度和内隐态度的一致(或者说不一致)问题,这时必然需要应用有效的内隐态度测量工具。Mai等(2011)在进行内隐态度度量时采用IAT方法,探索消费者对健康食品/非健康食品的态度。他认为需要对被试进行态度层面的分类,即从外显态度和内隐态度两方面将样本分成4类。消费行为很多时候受到无意识的内隐态度的影响,因此当消费者的外显态度和内隐态度出现较明显分离时,就可以以此作为切入点,探讨这种分离的来源。类似地,Prestwich,Hurling和Baker(2011)通过IAT检验内隐态度是否能预测消费者对健康/非健康食品的“购买”行为,deBruijn,KeelConner和Rhodes(2012)应用IAT探查消费者的“习惯强度”、内隐态度与对水果的消费行为之间的关系。从近6年(2006~2012)健康心理学杂志(JoumalofHealthPsychology)发表的文章看,约有36篇文献涉及IAT。实际上,由于消费者健康心理研究中较多地涉及健康/非健康食品的内隐态度测量(喜爱/厌恶),这种单维度测量十分适合采用IAT。
5)将IAT应用于内隐动机研究。内隐动机与外显动机在形成过程方面有明显区别,从发展心理学角度讲,外显动机来自语言传输的价值观、目标,个体需要学习言语交流以理解这些东西,并逐渐整合纳入自我概念和社会准则。外显动机是可察觉的意识层面的动机取向(McClelland,Koestner,&Weinberger,1989)。内隐和外显动机对行为产生不同的影响。内隐动机与那些自发性的行为有关,并能预测个体长期的行为趋势,外显动机与经过意识参与思考和决断的行为更加有关(schultheiss,2008)。内隐动机与消费者心理研究有何关联呢?市场营销和消费者行为研究表明。动机(Bargh,2002)、内隐认知过程(Bargh,2002;Messner&Vosgerau,2010)是消费者行为背后的重要心理因素。消费者始终暴露于外界刺激之中,具备激活内隐动机的外界条件,将内隐动机理论引入消费行为研究将会产生很多有益的研究结果(Sheldon,King,Houser-Marko,Osbaldiston,&Gunz,2007)。Brunstein和Schmitt(2004)将IAT应用于内隐动机的测量,研究发现IAT测量内隐动机的结果能够与PSE的测量结果良好聚合。
关键词:成绩测试;题型;评价
口语课成绩测试主要目标是为了检查学生对口语课所学内容的掌握情况,这包括学生对所学言语要求的掌握程度及运用汉语进行口头交际的能力两个方面;另外,它的目的是检验教学效果,为总结教学经验、改进教学方法、提高教学质量提供依据。
美国著名的心理学家和教育学家Thomdike提出过教育测量常用的三个步骤:首先要明确被测试对象的性质和属性;其次,必须确定能使这种属性显示出来并被感知的一系列操作;再次制定程序或规范以便把观察到的现象转化为程度和数量的陈述。依据这一理论,口语测试设计应考虑测试的对象及其特点、设计的内容、形式、题型以及评分依据和标准等一系列的问题。
在现行的口语课成绩测试中,存在着题型比较单一,教师印象分占很大比重的问题。为了解决这个问题,本文以初级阶段本科学生为对象,对口语测试题型进行设计和方法的尝试。
一、测试的对象及特点
1.测试的对象。测试的对象为来华一年级的留学生,试题的设计要全面反映学生的听说能力,材料的内容也要符合学生交际规律的心理特征。留学生往往想表现自己思想的成熟和知识的广博,但在使用汉语时,会发现他们的语言表达能力不强,因而容易影响口试的进行。在口语考试的设计中应根据学生的实际语言水平,编制合适的问题。
2.知识水平。在初级阶段,口语课的教学目的就是“使学生掌握初步的口头交际的言语技能和言语交际技能”,培养学生初步的口头交际能力。因而,口语测试也就是要考查学生的口头交际能力到底怎么样,学生的初步口语交际能力主要包括以下几个方面:(1)简单的日常会话能力。这是学生在言语交际中最需要的。日常生活中,学生要跟不同的人打交道,他应该知道怎样表达自己的基本想法和要求,并对对方的话作进一步的言语反应。(2)掌握语音技巧的能力。这指的是“声、韵、调的准确性,重音、停顿的正确掌握以及语气语调的恰当运用”。在初级阶段,要求学生掌握正确的声、韵、调及在语流中的正确变调,而到了一年级后期,要求学生能够掌握正确的句中重音,恰当的停顿,能很好地运用各种语气语调。(3)正确运用口语词汇和表达方法。口语和书面语在词汇、表达方法和句式结构方面都有所不同,学生通过口语课的学习和训练,应当能掌握口语词汇、表达方法的正确用法,在进行口语表达时能够根据场合、交际双方的身份、地位和文化背景等,选择恰当的语气和表达方法,注意表达的得体性。(4)成段(篇章)表达能力。它要求学生将语言材料按照一定的逻辑联系,运用恰当的篇章结构形式连接起来,进行完整的叙述说明,或表达自己的意见、想法。这也是初级阶段口语课训练的最高要求。我们在对外汉语口语成绩测试中应以能力的要求为测试设计的指南,为遵循的尺度。
二、设计的内容
1.语音、语调、节奏。考查学生的语音是否准确、清晰、语调是否自然流畅,还要注意其连续、重音、儿化、“一、不”变调等技巧的使用。意群断句是否正确、是否有节奏感也是考查的要求。
2.语法、词汇。考查学生语言的组织是否准确、得体;句法结构是否多样化,能否不仅使用简单结构,而且使用复杂的结构;词汇使用范围是否狭窄,是否合适;等等。
3.交际策略。考查学生能不能根据不同的交际场合,选用不同的语言;能不能借助手势、表情等非语言手段,提高交际的效果;能不能在交际中克服语言障碍,维持交际;能不能在交际中遵守汉语交际的基本礼仪;等等。
三、测试的形式
口语测试一般有两种做法:一种是面试,一种是面试和笔试相结合。有的面试没有录音,完全靠主考教师的印象,所以评分容易出现偏差。至于笔试更有悖于口语考试的原则,也与其特点不相符。所以应采用录音的方式,就是把考生的口语回答通过电话或语音室的设备将其录制到磁带上,评分人员再给出分数。把试题全部灌入在事先准备的录音带上,学生回答问题时不用笔而用口回答,并录制在录音带上。这种形式的测试比较经济,因为在语音室里,每次可测试大量的考生,而且人员要求少。
四、测试的题型
口语测试的题型较多,设计时应考虑测试的目的、测试的对象及其水平而选用不同的题型。纵观历年的口语考试题,并结合笔者的摸索,觉得有几种题型颇具口语特色,适合初级阶段的口语成绩测试。
1.朗读。朗读是指考生朗读单音节字词和双音节词语。口试时,主考教师将要求朗读的材料交给考生,考生稍作准备后再开始朗读。试卷中包括了轻声、儿化、变调(连上和“一、不”的变调)以及留学生容易出错的音和调。这类题主要考查声、韵、调、儿化、变调、轻重音的标准程度。
2.判断并说出正确答案。这类试题重在考查学生在具体真实的语言环境下辨析语气停顿、逻辑重音的能力及对口语词汇和口语句式的掌握情况,避免在交际中产生歧异,影响交际效果。
例如:判断并说出A、B、C、D四个答案中哪一个才是画线句子的意思:
哦,他没去过北京?
A.他没去过北京。
B.他没去过北京!
C.他没去过北京?
D.他没去过北京吗?
3.改说句子。改说句子是指用所给的口语词汇或口语句式改说句子。这类题型意在考查真实语境下学生对比书面语与口语的不同,同时考查学生的语感及应变能力,一改传统“改写”为“改说”,突出了口语考试“说”的特点。
例如:(1)没想到重庆火锅这么辣,我可不敢再吃了(再也不)。(2)大学毕业以后我们一直没见过小李(再也没)。
4.看图说话。口试时,给学生一张图画,让考生准备几分钟,然后根据这些图片说话。图片可以是单幅的,也可以是多幅的。“用图画来让学生说话是一种很有效的口语测试方式。它通过一种非常直接的方式让考生开口,充分展现其口头表达能力和想象力(刘润清、韩宝成,2000)。”
让学生对图片进行排序也不失为一种好办法。
5.自由谈话。自由谈话就是根据指定的一个或几个话题,让考生挑选,经过几分钟的准备,就某一话题自由谈话或口头叙述。话题要切合实际,与留学生生活联系密切。例如:(1)说一说你喜欢的季节;(2)谈谈你的业余爱好;(3)说一说你最难忘的一次旅行;(4)谈谈你喜欢的体育运动。
五、评价依据与标准
1.评价依据。应体现初级阶段口语测试目标,重点考查学生的交际能力。不应只注重学生话语的准确性,是否有语音、语法错误;而应注重其流利性、得体性,重视话语的实
际意义及连贯性;既重视语音语法结构等诸方面因素,又重视考生所表达的整体效果。杨钟琳认为,“口语表达除了要求结构正确之外,还有发音语调问题”;“口语的表达还有是否顺畅流利的问题”;“口语表达测试的评分标准应该包括正确、流利和易懂三个方面”。口语测试还应该从正确性、得体性、流畅性、有效性四个方面评价。
2.评价标准。口语评价方法通常有两种,即分析法和综合法。分析法就是将口语分解成若干要素,如语法、内容、语调、流利度、准确读词汇等,评分人员根据一定的标准对不同的要素(可作不同的加权处理)分别评分,各个要素得分总和即为总分。综合法是评分人员根据一定的标准,凭总体印象给学生打分。综合法能从总体上把握考生口语表现,效度比较高;分析法注重口语的各个组成要素,更为客观一些,信度较高。因此,一些大规模标准化口语测试(黄素华,1998),如剑桥大学考试委员会的口语测试都是采用分析法和综合法相结合来评分,既保持总体印象也不忽视口语的各个要素。为了保证评分的合理性与公正性,口语测试至少设置两个评分老师。一位老师担任主考,其余为评分人员。主考老师要参加问答、控制时间,因而宜用综合法。评分人员将以上的四个方面进行细化,采用分析法进行逐项评分。评价标准应注意要素清楚,易于操作,便于评分人员把握尺度。评分标准包括评价项目、权重、评价要素、等级与分值,等等。总设计分为100分,评分时对四大方面分别评分(主考采用综合法),各项的得分相加得到总分,然后换算成A、B、c、D四个等级。
六、初级阶段口语成绩测试样题设计模式
1.样题级别。样题应根据初级阶段留学生水平确定。
2.评价性质。评价按功能来划分,可分为诊断性评价、形成性评价和终结性评价。终结性评价是指在教学活动一个段落后,对其最终的结果所做的评价。要做到形成性评价与终结性评价相结合。学生口试的最后得分,可考虑形成性评价,包括课堂上师生活动、学生之间的问答、对话和表演,按30%与终结性评价按70%的比例将两者计入总分。