2011年8月第34卷第3期现代外语(季刊)
ModernForeignLanguages(Quarterly)August2011Vol.34No.3
《语言测试与评价》(第二版)述介
山东财政大学/北京师范大学
贾贻东
ElanaShohamy&NancyH.Hornberger.2008.LanguageTestingandAssessment(Secondedition).Springer.xxv+499pp.ISBN-13:978-0-387-32875-1.
继1997年KluwerAcademicPuslishers出版公司推出八卷本的《语言与教育百科全书》(第一版)后,2008年Springer出版公司又推出了十卷本的《语言与教育百科全书》(第二版),两个版本中的第七卷都是《语言测试与评价》。如果说第一版是总结过去、概览语言测试理论与实践发展到20世纪90年代初的历程,那么第二版则更多是站在21世纪发展的高度,回顾和阐述该领域的各个理论专题的历史形成、发展概貌,并展望未来,指明未来的研究方向,体现出百科全书所具有的全面、精炼、视野广阔的特点,为语言测试研究提供了一个更加丰富的信息资源库。
(第2、3章);社会分工日益细化,除了用于专业目的的语言评价成为新焦点(第4、5章),语言学能中哪些成分能影响和帮助学习者提高语言水平等也正成为另一个关注话题(第6章)。
第二部分(7-16章):评价的方法(MethodsofAssessment)。第一部分讨论的各种语言能力构念如何测出来呢?这一部分就是对这个问题的回应:即采取多种测试和评价方法来测出复杂的语言能力。传统的测试形式是大规模语言评价,其优点是施考时间、评分标准及分数解释等保持一致,不足是缺乏灵活性,诊断信息和反馈信息不足等(第10章);因此,“非传统测试”(包括行为测试、课堂评价、学习成长袋等)因其灵活多样、易于操作而逐渐受到重视(第7、8、11章);对效验方法的重视始于20世纪90年代,它是对评价结果进行解释和使用的过程,第12章结合Kane(1992)的“解释性论证”和Bachman(2005)的“评价使用论证”,提出了自己的论证推理框架,并阐述了每一步推理所需的各种效验方法;以心理计量为主的量化方法是传统的语言评价研究手段,因此,第14章以是否使用了心理计量方法为标准,对两个代表性的刊物《语言测试》和《语言评价季刊》中的论文进行全面检索,发现前者方法较单一,多使用心理计量方法,后者方法多样,除量化方法外,还包括了多种质化方法;第13章就用质化评价方法对口试进行研究,发现其方法多样灵活,不足是太主观,无统一评分标准;此外,教师培训已经成为另一个关注的焦点。从测试的发展阶段看,教师与命题者之间的关系已从各司其职到
1.内容简介
《语言测试与评价》(第二版)全书共分四个部分,由二十九章组成。
第一部分(1-6章):语言领域的评价(AssessingLanguageDomains)。语言测试与评价的对象是语言能力,而语言能力到底是什么?由什么成分组成?该部分从多个视角回答了这个问题,即语言能力的构念不是单一的,而是的、多面的,尤其是在全球化的大趋势下语言能力的构念变得更加多样。从时间上看,20世纪60年代以来语言测试经历了从重视“分离式”的语言知识到重视综合的语言技能,再到重视语言的单项技能的发展(第1章);从空间上看,20世纪后半叶英语在世界迅速传播,形成了多个变体,尤其是世纪末的、跨地区人口流动加速,由此多语言、多文化的特点成为语言评价必须面对的现实问题
324
《语言测试与评价》(第二版)述介
两职兼容。教师培训有两种渠道:教材和网络,尤其后者更能为教师提供最新的和资源等,但问题是如何向教师提供统一的岗前和岗上培训,因此建议未来应采用多元培训形式(第15章);把最新的计算机技术运用于具体目的(如电脑适应性测试用于水平测试、编班测试等)和运用信息网络资源来建立语料库(特别是专业语料库)也正成为热门的语言评价研究话题(第9、16章)。
第三部分(17-25章):教育中的评价(AssessmentinEducation)。面对全球化背景下形成的多语言、多文化的教育现实,本部分讨论了语言测试与评价手段在教育中的各种具体形式和功能。课堂评价是语言评价在学校环境中最具体的实现形式,它应该是一种“学习评价”(assessmentaslearning),能为学习者提供有益的反馈,以提高学习效果(第17章);从本质上说课堂评价是一种“动态评价”(DynamicAssessment),它有以考促学、考学相融的优点(第18章),能够在学校形成一种能有效提高学习效果的文化氛围,且学生也能在评价中发挥积极作用(第19章);由历史原因形成的特殊群体(如土著人、移民)的语言评价成为教育界面临的重要问题,如美国、澳大利亚等国一方面采用双语教育模式,另一方面又通过立法确立了用英语进行各学科评价的合法性,如美国2001年通过了《不让一个孩子掉队》法案,明确学生用英语进行测试的表现要与的资金支持挂钩(第20、21章);因此,应采取各种调节手段,公平地评价二语学生的语言水平,同时又不致损害语言评价的信、效度(第22章);大规模语言测试产生的反拨效应研究,表明它是一个极复杂的问题,但有些教育部门仅把语言测试作为教育改革的工具,而忽略了存在的问题(第23、24章);儿童学习者是一个新的评价目标群体,要开发高质量的评价题目,题目的形式要符合儿童年龄特征,任务类型符合儿童的认知加工特点,内容要符合儿童的心理和文化特点(第25章)。
第四部分(26-29章):社会中的评价(AssessmentinSociety)。本部分的四章探讨了
语言评价在社会、政治等更广阔的视角下的各种问题。高利害测试多被教育部门用作语言教育的工具(第26章);语言测试还可以在确定难民身份及移民就业中发挥其社会价值,但存在不公平现象,因为语言测试缺乏更广阔的社会学理论(第27章);因此,要确保测试的公平、道德,维护各个利害相关者的利益,不要把相关的规则变成摆设(第28章);回顾过去的发展历程,未来研究中还需解决大量问题和各种不确定性,“语言评价”这一复杂构念所涉及的各种矛盾、问题和困难还有待我们进一步去研究和解决(第29章)。
2.简要评述
《语言测试与评价》(第二版)作为该领域最新的百科全书,对过去语言评价理论和实践涉及的各个方面进行了全方位的回顾和总结,展望了未来发展,显示出这一学科蓬勃的生命力。概括起来,本书主要有以下三大特色:
第一、凸显了语言评价理论和实践的最新发展趋势。2005年Bachman提出的“评价使用论证”(AssessmentUtilizationArgument,
AUA)已经成为测试学界一个非常有影响力的理论模式,本书的第9章不仅讨论了这一模
式,还以此为基础提出了自己的效验推理模式。自20世纪90年代以来,各国之间的经济、文化交流频繁多样,其已经成为各国教育部门特别关注的问题,因此,2001年美国通过了法案《不让一个孩子掉队》,欧洲文化委员会颁布了《欧洲语言共同参照框架》,本书详细地讨论了它们对教育和评价的影响及存在的问题。过去十几年以来,计算机网络技术获得长足进步,2005年美国教育服务中心推出的“托福网考”也反映在本书中;语料库在语言评价中的研究和应用也单辟一章给予了详细关注(第
16章)。
此书还关注了课堂形成性评价。在反思了大规模标准化测试产生的各种消极反拨效应后,课堂语言评价成为近年来测试学者重新认识和探讨的领域;本书专辟一章(第17章)阐
贾贻东
325
述这个问题,书中还有其他多个章节也有相关讨论。
另外,对反拨效应也有了更深入的研究。
部分。然后,把评价放在更宽阔的视野下,关注其在教育中的作用,这是该书的第三部分;同时,在全球化的趋势下,如何保障语言评价的实践和操作的公平道德,以期体现出社会价值观的民主化和多元化,这构成了该书的第四部分。从第一部分到第四部分层层展开、环环相扣,体现出百科全书作为权威信息资源的高度逻辑性。
同时,尽管每一部分的各章出自不同的作者,探讨的是不同的话题,但在许多章节中间和末尾,作者都及时提供了本书中其他有关章节供读者参阅,使整书的二十九篇文章多而不散、融为一体。另外,各章的体例基本相同,都是由“引言”、“早期发展”、“主要贡献”、“最新进展”、“存在的问题与困难”和“未来发展方向”等几部份组成,使读者能在有限的空间内了解该话题的发展全景。
该书作为最新的测试学信息库,尽管力求完美,但也存在一些瑕疵。比如,第4章专门论述了“交际语言能力”(communicativelanguageability,CLA)的各种理论模式及组成成分,这一理论模式在测试学界可谓人人皆知,而且其在该书的多个相关章节中多有提及并讨论,而书后的“主题索引”却没有一个词条,这种缺失对于一部权威的百科全书而言不能不说是一大遗憾。
但瑕不掩瑜,相信该书必将成为语言测试与评价研究者的良师益友。
参考文献
90年代以来,测试学领域中另一个研究热点
是学者们更加关注测试的反拨效应:反拨效应的本质是什么?在产生积极的反拨效应同时,如何尽力避免消极的反拨效应?该书第23、26两章专门详细论述了最新的研究发现。
研究范式的转移是另一个最新的发展趋势。以两个关键词testing和assessment为例。在第一版中,尽管四部分的题目都以testing和assessment示人,但实际讨论更多的是大规模的语言测试,所以文后的“主题索引”中,
testing有关的词条有20条之多,assessment则只有4条;第二版中,四部分皆以assessment出现,书后的“主题索引”中,testing有关的词条有36条,assessment则增加到22条之多,
这种变化反映了近年来测试学领域的研究正在转向对各种评价的关注(当然也包括了测试)。
第二、全书内容知识比第一版更加丰富全面。从内容上看,两个版本都由二十九章组成,第一版的正文有333页,由四部分组成,第二版的正文有454页,也是由四部分组成。但相比之下,第二版视野更加广阔:该版不但从新的视角探讨了第一版中的话题,而且在第三部分专门论述了各种评价在教育中的作用及影响,这是第一版中所没有的。从讨论的话题上看,第一版的编者在前言中预见未来发展时,提出未来需要关注三大领域:一是不同场景下的语言能力构念如何评价以及影响的因素,二是“非传统评价形式”,三是评价的影响力和道德问题,时隔11年后这些问题在第二版中都有了详尽的研究和论述。因此,第二版是对第一版的发展和延伸,使我们对语言评价的理论和实践诸方面有了更加全面的认识。
第三、本书脉络清晰,逻辑透彻,可读性强。从宏观上看,语言评价的两个核心是what(构念或特质)和how(测量方法),前者是语言评价的对象和目标,构成了本书的第一部分,后者是测量的工具和手段,构成了本书的第二
Fulcher,G.&F.Davidson.2007.LanguageTesting
andAssessment:
[M].Routledge.
AnAdvancedResourceBook
Wood,R.1993.AssessmentandTesting:ASurveyof
Research[M].CambridgeUniversityPress.
收稿日期:2010-05-20;
作者修改稿,2010-11-19;本刊修订,2011-05-28
通讯地址:250014山东财政大学外语学院/100875
北京师范大学外文学院(博士研究生)
<jnjyd@163.com>