【托福口语】口语的考查形式是否会改革？-北木教育

文都国际教育小班精品教育，中外名师面授，签约保障在线咨询

雅思暑期封闭班限时优惠，9折惠

【托福口语】口语的考查形式是否会改革？

发布时间：2018-08-28 文都国际教育

近期ETS在北京举办了托福考试分享会，针对托福口语考试的考查形式、评分公平性及中国考生如何提升口语能力提出了几项问题，我们一起来看看说了什么？

作为一项语言应用能力测试，TOEFL如何确保能够检测到考生的真实语言应用水平？ETS会考虑在口语评测方式上借鉴IELTS和BEC口语测试的考察形式吗？（注：IELTS 口语测试中，考官会与考生进行面对面的交流；BEC 口语测试中，会安排多名考生进行合作交流）

作为语言测试，任何评估方式都既有优点也有不足。托福口语考试采用录音的形式，如果考官比较严厉有可能分数会比较低，但如果碰到了会说两种语言的的考官则相反，分数会相对较高。面对面交谈的考察形式（如IELTS ）有优势，但考生分数也容易受到考官主观因素的影响。如果考官比较配合，表现得比较支持，考生有可能发挥得更好；相反如果考官比较严肃，考生则可能会比较紧张，可能影响最后的成绩。至于两位甚至多位考生互相配合的情况（如BEC），考虑到学生的程度不同，如果一个学生比较主动，另一个较被动的话，可能会影响分数评判，所以没有哪一种测评方式是无缺的。

就托福口语而言，我们也在进行各种调查和研究，考虑在形式上加一些新的设计，但还没有最终决定，可能是5年之后，也有可能是更久以后。这需要研究员针对新的考试形式进行设计，需要各方面的专家进行检验审核，以确保其有效性。并且，创新的同时总是难以避免错误，所以ETS现在的态度十分谨慎。最后还需要说明一点，合作能力（cooperation skill）、问题解决（problem-solving）等能力的考察，并不仅仅是在考察语言的熟练使用程度（language proficiency），也是在考察交流能力。

TOEFL IBT 未来会不会考虑增加对考生学习能力（如问题解决能力）的考察？

TOEFL IBT 是一项检验学生语言熟练使用程度的考试，我们用它来评测一名国际学生在英文学术环境中是否具备足够的语言技能。至于国际学生的学习能力和学术上的成功（academic success），并不是语言能力测试所致力考察的。

TOEFL IBT 口语部分每道题的答题时间只有45秒或60秒，如此短的时间是否足以评判学生的语言能力？

就口语测试来说，最理想的考察方式当然是将考生尽可能多地放入不同场景里，检验考生在不同情况下与不同对象的沟通能力。但事实上，我们不可能用这样的方法去测试每一个考生，毕竟整个托福考试的时间已经很长了。
TOEFL IBT口语部分设计了6个任务（6 Tasks），这已经比很多考试都多了。大家真正关心的可能是，这6个任务的分数，是否足以说明考生在现实生活中的口语能力。事实上，ETS展开了大量追踪调查，调查结果显示：口语成绩取得高分的学生，在生活中口语表达能力也非常优秀。基于此，我们认为60秒足够我们对学生的语言能力进行评估。

在托福口语成绩单上，我们发现有一些分数是几乎不存在的，例如12，16，21，25，请问这种“ 跳分（skipped score）”现象出现的原因是什么？

众所周知，托福口语成绩并不是由原始分数直接相加而得，而是在原始分数的基础上取平均分，再通过一个分数换算表（score conversion）转换而得。因此不可避免地出现了一些“ 被跳掉了的分数（skipped score）”。这一现象过去在写作中也存在，但后来我们在写作中引入了e-rater，这些空缺的分数就被填上了。

那ETS会考虑将e-rater应用到口语评测中吗？

自动化评分（automated rating）确实有一些优势，毕竟电脑在运算速度和正确率方面都远超人类，但电脑也有自身的弊端。
目前 e-rater 在托福写作评测中的作用是辅助性的：人类考官评测内容含义，而e-rater检测语言特征（linguistic features），e-rater和人类考官相互结合以确保评分连贯精准。未来口语考试的评测肯定会发生一些变化，但我们在确保新评测方式能充分运行（fully function）之前是不会草率发布的。毕竟，如果在口语考试中引入自动化评测，口语的测试形式也需要随之改变。

在对TOEFL 考生的成绩进行统计和分析时，我们发现阅读和听力分数的上升趋势十分接近（follow each），口语和写作分数上升趋势也十分接近，请问这是TOEFL IBT的设计吗？这对于英语学习者或者学生们有什么意义呢？

这是很自然的现象。以口语-写作为例，毕竟在回答问题时用到的一些技巧是相同的。但这两个曲线也并没有完全重合，所以肯定也是有一些技巧是不同的。对此，ETS官网上有很多相关数据信息可供大家参考。

似乎对很多中国考生而言，口语部分是最难提升的，对此您怎么看？

对于任何一个外语学习者而言，口语都应该是最难的。影响口语学习的因素众多，比如学习者的母语、学习动力和努力等。学习外语时，学习者的语言熟练程度（language proficiency）可以通过不断的练习和纠正来提升，但也有可能因为练习的间断和空缺而失去。
语言是一种非常复杂的现象，学习语言也是一个十分复杂的过程，每个学习者的情况都是不同的。一般情况下母语会对二语习得产生干扰，但这并不代表口语就不能提升，有很多的中国学生英语口语能力很棒。不过口语的提升确实需要很多努力，不是一个轻松的过程。

TOEFL IBT仅由人类考官评判口语分数，并且只评一次，如何保证公平性？

首先，6个任务并不是由一位考官独立评估，而是由3至6位考官分别评估后取平均值。其次，为了保证考官评分的准确性，我们有基准答案（bench mark response）——区分不同分数的参考答案。我们用基准答案对每一位考官进行测试，如果考官评分与基准答案不符，该考官必须接受培训。

未来，托福写作中e-rater 有可能完全取代人类考官吗?

虽然 e-rater 确实在一定程度上保障了写作评分的便捷和准确性，但我们同样重视人类评分，因为电脑不能评测所有的东西。我们不希望自动化评测盖过考试本身的设计，这也是 e-rater 现在只用在了写作的评测，还未用到口语评测的原因。

声明：该文观点仅代表作者本人，北木教育系信息发布平台，北木教育仅提供信息存储空间服务。网站上部分文章为转载，并不用于任何商业目的，我们尽可能对作者和来源进行通告，但是因能力有限或疏忽，造成漏登，请及时联系我们，我们将根据著作权人的要求，立即更正或者删除相关内容。

申请入驻

文都国际教育小班精品教育，中外名师面授，签约保障在线咨询