Review on Assessing Academic English for Higher Education Admissions
The internationalization of education has enabled universities to attract candidates across the globe, leading to unprecedented importance attached to academic English assessment for admission purposes. With the rapid development of technology, academic English assessment is facing new challenges. The book Assessing Academic English for Higher Education Admissions surveys the definitions of the four language abilities: reading, listening, writing, and speaking, and focuses on interpreting the construct framework of assessing academic English abilities. Using TOEFL iBT, IELTS, and PTE as examples of academic English tests, the book compares and contrasts the practical operations of these assessments. It expounds on the latest advancements of construct and technological empowerment in academic English assessment research and points out the direction of future research, which is of great theoretical and practical value and will be an important inspiration for the future research, development, and reform of academic English assessment.
Academic English Assessment
《以高等院校录取为目的的学术英语测评》(Assessing Academic English for Higher Education Admissions)由国际语言测评研究领域的两位知名学者Xiaoming Xi和John M. Norris共同编著完成,二者曾经是同事,供职于美国教育考试服务中心(Educational Testing Service, ETS)
第一章“为录取决策制定学术英语测评框架”,Norris、Davis和Xi重点介绍了高等院校招生考试和考生英语水平的关系,多角度阐释了学术英语(English for Academic Purposes, EAP)的定义、传统测评方式和新兴测评趋势,并简要介绍了本书各章的内容框架。二战后,在英语为母语的国家寻求高等院校求学机会的申请者逐渐增多,这促使高校开始采用标准化学术测评,从中选出具备学术潜力的考生,其中一项潜能指标就是语言水平。在非英语母语国家,高等院校也逐渐增设了以英语为媒介授课(English-Medium Instruction, EMI)的课程和学位项目。这些变化使传统的EAP定义也随之不断发展。作者借此回顾了标准化学术英语测评的传统方式,并结合数字技术应用的普及,概述了近年测评构念和技术应用的创新,如综合语言能力测评、基于论证的效度验证和自动评分等。
第二章为“测评学术阅读”,Schedl、O’Reilly、Grabe和Schoonen引介了具有影响力的主要学术英语阅读能力测评的理论模型和实践框架,分析了数字技术的快速发展对阅读构念的影响,并讨论了学术英语阅读构念的扩展。作者梳理了一语和二语阅读能力之间的相似性,指出学术英语阅读需要复杂的认知能力。基于既有阅读能力模型,作者提出了一个更适用于学术环境的阅读理解测评模型。该模型强调学术阅读任务、阅读目的、文本特征及读者阅读能力的动态交互,尤其适用于整合跨文本信息的阅读测评。随着数字技术的普及和信息来源的多元化,学术工作中对多元数字阅读能力的认知要求越来越高。因此,如何将跨文本阅读纳入大规模学术阅读测评中以扩展学术阅读的构念是学界当下需要思考的议题。作者指出,未来学术阅读测评研究可以将短期课题作为基础研究,如国际学术语域和需求分析,以进一步探索一些长期议题,如跨文本学术阅读能力测评、基于数字技术的测评任务开发、影响文本复杂度的因素和高风险学术英语阅读测评中的阅读策略等。
第三章为“测评学术听力”,Papageorgiou、Schmidgall、Harding、Nissan和French探究了学术英语听力能力的定义和测评内容与方法,构建了学术听力理解测评的一般构念框架和语境维度模型。作者通过分析听力认知加工模型、听力能力成分模型和听力能力教学模型,讨论了学术听力所需的知识、技能和能力。作者综合考虑EMI高校语境中影响考生学术听力能力的因素(如专业学科背景与规范、远程教学、翻转课堂、非英语母语授课教师增多导致的英语口音多样化等),提出了一个基于语域、交流目的以及听力技能三维度的通用学术英语听力构念。听力构念是多维度的,但听力测评实践操作有局限性,无法完整体现多维构念。作者以TOEFL iBT、IELTS和PTE的学术听力测评细则为例,对比阐述了三者在学术听力测评构念和语境设计上的差异。作者指出,未来学术听力测评的研究应关注多模态听力和口音多样化对听力测评构念的影响、学术情景的交互性、语用理解的测评和考生特征等。作者借鉴第五章“测评学术口语”的方法,界定了听力任务设计的语境维度:语域、体裁、任务目的、话语互动形式(如独白)和话语环境。
第四章为“测评学术写作”,Cumming、Cho、Burstein、Everson和Kantor讨论了学术英语写作能力的定义、写作测评的类型、学术英语写作测评实践操作以及写作测评的开发和验证。作者指出,大多数写作测评的设计指导理论是交互性原则,主要以基于任务(task-based)的形式出现。在实际操作中,TOEFL iBT、IELTS和PTE学术写作测评的任务类型相似,但使用的评分量表和人工/自动评分方式存在差异,体现了不同的测评构念。作者采用基于论证的效度验证(argument-based validation)方法,从评分、概化、解释、类推和决策推理概述了写作测评设计中的重要议题和研究成果。作者建议未来学术写作测评研究需进一步明确任务要求和评分标准,增加语域和体裁类型,开发考察综合能力的学术写作任务,改进自动评分技术等。
第五章为“测评学术口语”,Xi、Norris、Ockey、Fulcher和Purpura探讨了学术口语的定义和学术口语测评新的可能性。在前几章的基础上,作者全面系统地引介了学术口语测评中作为核心理论的交互性原则,对学术口语语境的界定进行了梳理,讨论了学术环境中口语交流的形式,对学术口语能力的组成部分、任务以及评分量表的设计进行了论述,并以TOEFL iBT、IELTS和PTE学术英语口语测评为例,界定了学术口语能力测评的构念。作者探讨了学术口语测评设计的新视角,如学术演讲中的命题测评、语用意义测评以及多人交互能力测评等,概览了有助于扩展学术口语测评构念的因素,如评分量表、评分方式、评分报告的设计和口语自动评分技术的应用。作者指出,未来研究应开发基于语境的学术口语理论模型,结合EMI高等院校口语交际的语境和在线教育技术的进步扩展学术口语的构念,开发新的任务类型和评分量表,以反映新构念,利用数字技术开发更真实的学术口语测评语境,并继续研究用于自动评分和自动反馈的技术。
最后一章为“展望下一代学术英语测评”,Chapelle从构念定义、任务设计和技术应用等方面整合了读、听、写、说四大语言模态各章的内容,提出了一个值得深入探讨的问题:学术英语测评分数的解释应该基于单项语言模态还是整体语言能力构念?作者提醒读者,虽然每章对未来学术英语测评的任务开发都提出了建议,但这些建议在精确程度和可操作性方面存在差异,这些新的任务类型的有效性还有待其分数解释的效度证据支持。其效度验证的主张关注语域研究的充分程度、测评任务的恰当性、测评分数的准确性和一致性、测评分数反映构念的程度、测评分数的类推性、测评分数对于决策的可用性和测评成绩使用的公平性。然而,这些主张还依赖于学界对学术英语语域的界定以及分数解释框架和实践技术的进一步发展。未来学术英语测评可以关注学术英语测评的国际环境,融合前四章的内容对学术英语测评任务细则和任务特征进行标准化设计,界定解释框架中的“学术语言”,使测评结果的解释范围和用途更加明确。
本书集结了语言测试学界和业界知名学者的视角,讨论了学术英语测评的核心议题,综述了用于高等院校录取的学术英语测评的最新进展,结合TOEFL iBT、IELTS和PTE学术英语测评的实际操作,为读者呈现了论证严谨、综合全面的学术英语测评知识体系。全书具有四个突出特点:
第一,本书提出了与学术英语测评构念相关的四个框架,具有创新性。学术听力/口语任务的语境层面框架涵盖了语域、文体、目的、话语交互程度和话语环境层面,有益于未来学术英语听力/口语测评的语域界定和评分量表开发;单一学术英语能力的测评构念,如适用于学术英语阅读理解的测评模型强调阅读能力、文本和阅读要求的相互关系;学术听力理解测评通用构念框架为学术语境下的英语测评研究提供了更契合的理论基础;综合学术英语能力的测评构念,如Chapelle在整合各章单一语言能力构念的基础上,概述了一个用于高校录取的学术英语能力解释框架,采用基于论证的效度验证方法,肯定了综合学术英语测评构念的可行性。这些框架能够激发读者结合自身教学和科研经历与环境,构建适合本地化的学术英语测评框架,开展效度论证研究等。
第二,本书强调学术英语测评技术的重要性,强调技术赋能的测评构念和测评方法,拓展了传统的学术英语测评方式,具有前瞻性。本书提出学术阅读测评需关注电子阅读会如何影响学术阅读的构念,多模态学术听力测评需关注视频的使用在多大程度上增强了语言测评的真实性交互、视频输入与考试分数之间的关系、不同类型的视觉呈现与不同文体和不同学术学习情境(包括远程学习)配合使用的效果等。本书指出技术在测评操作中的可能性,如使用新媒介测评跨文本学术阅读能力,使用即时视频或虚拟空间实现口语互动测评,采用自适应测评、自动项目生成技术提供更贴合考生水平的测试题目,使用自然语言处理技术、语音技术提供更精细的诊断反馈,使用自动评分、自动反馈技术提高评分的准确性和可靠性等。技术扩展了数据收集的方式(如屏幕记录、眼动追踪、击键记录)和交互测评中数据的类型(如响应延迟、选择策略)等。学术英语测评技术相关的构念拓展、操作和实践建议为读者探索技术赋能下的学术英语测评设计、开发和改革提供了指引。
第三,书中提出的“未来研究建议”反映了社会需求和学术英语测评的趋势,具有启发性。主体各章详细讨论了各语言模态研究的发展,包括对学术语域的界定、互动性原则和语用能力的关注、相关技术的运用以及综合构念框架的研发等。读者可以从众多研究建议中找到感兴趣的前沿方向,开展研究。COVID-19疫情使学术英语测评遭遇了构念和实践上的挑战,本书对既有学术英语测评理论和技术的回顾和对未来研究发展趋势的探究无疑正当其时,具有重要的指导意义。
第四,本书布局清晰,案例详实,全面系统。第二至第五章分别以读、听、写、说四种语言模态为主线,基本按照“学术语言能力界定”、“学术语言测评的操作化”、“研究新发展”和“未来研究方向建议”的架构展开,有利于读者掌握章节的框架内容。在“操作化”小节,各章呈现了TOEFL iBT、IELTS和PTE学术英语测试的具体细则,对比说明,阐述分析,层层递进,对测评操作具有较强的参考价值。本书内容具有代表性和互补性,聚焦读、听、写、说四个语言模态的重要议题,理论和实践相结合,助力读者学术英语测评的实施和语言测评素养的提升。
该书也存在一些不足,如对语言能力测评的效度验证和重要理论的深入讨论出现在较后面的章节,可能不利于读者的理解,基于论证的语言测评效度验证方法在第四章写作部分才有深入讨论,交互性原则虽在多个章节有提及,但到第五章学术口语测评中才有系统全面的探讨
但是,瑕不掩瑜,该书不失为一本极具参考价值的著作,能够满足不同类型读者(如语言测评开发者、研究者、语言测评硕博研究生)的需求,其理论性、系统性、实践性和前瞻性肯定会对学术英语测评的相关研究与发展产生重要影响
本书评为:重庆大学研究生教育教学改革重点项目“硕博共享双师型国际合作课程建设”(CQU230210)的阶段性成果。