每日最新頭條.有趣資訊

雅思、ACT 都改機考了,被“天才槍手”們倒逼出的改革?

題圖來源:視覺中國

在測試學方面,英美國家一騎絕塵。

在托福(TOFEL)考試實行了多年的機考之後,美國高考 ACT(American College Test)也推行機考了。今年9月起,ACT 國際考場的紙筆考試全部取消改為機考。

ACT 是美國和加拿大地區用作大學本科錄取參考的標準化測驗,既是入學條件之一,也是包括8所常青藤在內的4000所美國大學與文理學院本科申請、發放獎學金的主要依據之一,以及對學生綜合能力的測試標準。

無獨有偶,在英聯邦地區,昨日(11月1日),作為雅思(IELTS)考試的主辦方,英國文化教育協會宣布,北京、上海、重慶三地的機考中心新增雅思考試機考模式。在這之前,中國大陸地區首場雅思機考已於8月31日在廣州機考中心舉行。

考場上的“機器博弈”

對於機考範圍的擴大,雅思考試主辦方很明確說過:這不會對現有紙筆考試的安排產生影響,機考與紙筆考試模式並行,考生可在二者之間自由選擇。

與現行紙筆模式相比,雅思機考模式在考試內容、評分標準、難度等級、考試題型、考試安全設定等方面均完全一致。考生可選擇通過機考模式參加聽力、閱讀及寫作三個部分的考試。

唯一不同的是,雅思特有的“人人對話”口語考試模式將保留。協會認為,人人對話的口語考試模式是最有效的檢測考生英語口語能力的測評方式,它能保證考生在最真實自然的交流狀態下發揮最佳水準。

機考的改革受波及的範圍不小。2017年,全球已突破300萬人參加雅思考試,或是出於降低考生的備考壓力的考慮,雅思官方宣布,雅思機考的認證名稱為 Computer-delivered Based,並不是 Computer-based——這也是向備考者強調的是,雅思機考的內容完全是 Paper-based 內容的電腦化而已。

但是 ACT 就不一樣了。

雖說官方宣稱 ACT 機考的內容基本上與筆考一致,但區別在於是,ACT 在國際考場推行機考模式是 CBT(The computer-based Testing),今年在國際考場推行的機考,是指電腦自適應測試(Computerized Adaptive Testing,CAT)。

這也和此前在美國本土的部分州所推行的 ACT 機考不同。它不是簡單的考試介質的轉變,而是一種基於電腦和網絡,為學生提供自適應答題的考試模式。

近年來,CAT 已經成為了一種非常熱門的測驗形式。正如現在教育培訓圈大熱的自適應學習(Adaptive Learning),自適應考試可以簡單理解為,CAT 是根據每位學生不同的情況設定不同的考題,每一位考生在同一考場面對不同的試卷和不同的考題。在考試的過程中,出題順序和題目內容將根據考生對上道題的作答情況決定,電腦根據考生的情況對下一道出現的題目進行適應性的調整。

ACT 考試中出現每道問題背後都有相對應的標簽難度。假設一位考生正在考試,面對系統給出的第一個問題,他提交了錯誤的答案,此時系統會自動檢測到錯誤結果,程式則認為題目的難度系統對於學生的成績水準相對較高,那麽,第二題會適當降低難度系數,自動匹配出與學生水準相應的問題。

同理,如果這位考生第二題回答正確,那麽系統會認定他能力不錯,便會推送一個相對較難的考題,依此類推。這樣的考試模式,可以確保考生不會做到和自己能力水準相差過多的題目,保證了考生最終完成的試卷和題目是與他的實際水準相匹配的。

ACT 對於考試的數字化變革十分堅決。其新上任的首席執行官 Jon Erickson 曾經對媒體表示,ACT 紙考會很長一段時間與數字化考試並行,但 ACT 的終極目標是將 ACT 考試100%的數字化。這個時間未定,可能在5年後,也可能是10年後。

Erickson 認為,學生們不必為數字化考試改革而擔心,ACT 從各個州的試點高中開始,一步一步檢測,直至成熟後才會推廣至全部考場。“我們會慢慢來,但是改革的腳步會很堅定。”

被“天才槍手”倒逼的改革

關於 ACT 為什麽要這樣做,留學教育工作者、美國矽谷教育機構 7EDU 創始人劉君的看法是,“ACT 和 SAT 是競爭關係,所以他們走先一步大面積試點。”

ACT 測驗由同名非營利組織ACT考試委員會(ACT. Inc.)負責組織管理。1959年,愛荷華大學教授 Everett Franklin Lindquist 發明 ACT 考試的意圖之一,就是與 SAT(Scholastic Assessment Test,學術能力評估測試)測驗競爭。此前,對於大部分有意向申請美國大學的中國考生來說,SAT 的認知度和普及度更高,自2011年起,ACT 參與人數超過了 SAT,此後, ACT 的考生數量一直凌駕於 SAT 之上。

作為 ACT 考試的服務商,電腦化考試測評技術和運營服務第三方供應商 ata 公司 COO 趙署秋告訴鈦媒體,ACT 新上任的長官者對於新興技術十分感興趣,一直在推動 ACT 往機考方向發展。

對於機考的改革,從 ACT 官方的發文中鈦媒體了解到,ACT 實行機考主要是為了保證考試的安全和公平。其背後潛在的意思是為了應對國際考試中,日益嚴重的作弊現象。

由於國際考試的時差特性,導致近些年大規模作弊現象的新聞頻出。去年底,泰國電影《天才槍手》戲劇化地還原了國際考試作弊的情境,講述了兩位智商超高、記憶力絕佳的學霸為了牟取暴力,幫助富二代學渣在國際高考 STIC 上進行跨時區作弊的故事。

2017年上映的泰國電影《天才槍手》,根據2014年轟動一時的亞洲考場作弊案改編,講述了天才學霸利用高智商考場作弊牟取暴利的故事。

故事取材於2014年發生在亞洲 SAT 考點大規模泄題事件。當年10月,一場 SAT 考試作弊涉案教育機構達到幾十家,包括中國在內的1萬多名考生受影響,據《英國每日郵報》報導,泰國考場一名中國女生作弊被考官抓到現行,該考生將手機藏在衣服口袋裡被監考老師發現,在她的手機中,監考官竟然發現了當日部分試題的相關答案。

2016年6月,ACT 發生了一次影響很大的考題泄露事件。因為這次事件,ACT 第一次公開表示因泄題而臨時取消考試,也是首次在整個國家和地區取消考試。原定於6月11日上午在中國香港和韓國的考試,在開考前幾個小時被緊急叫停,直接造成了56個考試中心被迫取消考試,很多考生在開考前一個小時才收到取消考試的通知郵件。由於當時中國大陸並未設定考點,內地的考生一般選擇前往這兩地考試,將近有5600名考生受到了影響。

@ACT考試官方微博 上至今還保留了這一通知。“由於考題泄露,ACT緊急取消6月11日在香港和韓國的考試。”

在這份聲明中,ACT 首席商業官(Chief commercial officer)Suzana Delanghe 表示,有人竊取並且售賣考題資料獲利,這對上千名學生造成了負面的結果。因此,ACT 不得不采取如此極端的手段以保證考試的結果的公正性。

一般而言,作弊是個人或者小團體的行為,這些考試的臨時取消,對於大部分誠信的考生並不公平。

令人遺憾的是,ACT 並沒有因此事而規避考試作弊采取有效的措施。第二年的9月7日,在考試開始的前兩天,ACT 官方又因為考題泄露取消了一次考試,受影響的考點包括了大阪、橫濱、新加坡、香港、澳門等地區。

“紙筆考試最大的風險就是安全問題。機考背後的主要邏輯就是,考試首先要保證公平、公正,但是更重要的是,考試要確保質量、效率和安全。”趙署秋告訴鈦媒體。

舉個例子,假如是在亞洲考點的安排的 ACT 考試,整個流程至少涉及到試卷從美國印刷廠印好,運輸,上輪船,由貨運到港口入關,然後報關,再由承辦的機構接收、保管,直至分發到考場。

“有時候卷子還沒有到岸,題已經到岸了。”趙署秋說,運輸和保管的環節太多了,不論用什麽方式,這畢竟是一卷紙,想要把它打開,中途有這麽多環節,任何一個環節都有可能出現疏漏。而往往,我們都無法得知是什麽環節出現了紕漏,“也不是說完全不可以查,只是查起來環節太多了,還涉及到海關清關的過程,大多數情況是查不到的。”

如果說大規模有組織的作弊是小概率事件的話,那麽國際考試長久以來盛行的“機經”,則是早就普及了的隱性“作弊”的方式。

長期以來,中國的輔導培訓機構傾向於研究題庫,對考題真題進行分析,稱之為“機經”。他們抓住了題庫固定這一“漏洞”。比如說,在以前,ACT 和 SAT 的某些考題,會在接下裡的考試中原題重現。中國的考生,尤其是參與國外語言考試的學生,或多或少都會接觸到這類“機經”。“背機經”成為很多中國重要的備考和應試手段。

應對機經最好的辦法,似乎是將所有考題隻使用一次就徹底封存,如同中國高考一般。但美國大學委員會曾表示,這樣做成本太高,會讓考生的考試費用增加一倍。而且即使使用一次性試卷,也無法避免有的機構利用時差作弊,或者嘗試盜取試卷。

與此同時,ACT 在線機考模式將縮短考試與成績報告的發布時間,對於考生的備考和申請效率大大提升。除非寫作類試題,機考幾乎將收題、判卷、成績反饋等的需要人工交接環節都替代完畢,將以選擇題為考試形式的考試評分以最快的48小時的高效反饋給學生。由於分數可以提前得知,有利於考生接下來的時間規劃,及時對備考做出調整。

此前考生的獲得成績,需要繁複的考卷收集、打包、運送、清關、再次發送、接收、解壓和最終掃描,以及反饋給考生成績,複雜環境可以得到改變。

變革派的邏輯

圖/視覺中國

機考不止於防止作弊和應試投機,它對整個測試水準的提升也有幫助,讓測試學變得更加合理和科學。

對於一些備考者,在寫作上,字跡不大好的學生可以把短板遮住,糾正時候不用塗抹,卷面得到保障,也減少了誤判的可能性。同時,由於機考的改革,為了國際學生增加更多的考試機會,每年 ACT 測試由之前的5次考試更新為6次考試安排。考試時間由1天調整為2天。

但有個問題一直存在於此類一年多次的考試——如何保證每次考試的考察出來的學生水準是一致的?

趙署秋十分推崇機考模式的變革。他認為,由於機器考試的實現,可以對試卷的難易程度做等值分析,這方面機考的獲取能力要遠遠多於紙筆考試。

比如說,機考可以通過追蹤和監測,了解到所有考生的平均答題時間,這在紙筆考試的過程中完全無法實現。比如說,一道數學考題的正確率很低,有時候並不是題目考察的點很難,而是其中句法和語法導致考生需要閱讀理解的時間太多,這類指標對於考試科學性的提升十分重要。

同時,一場考試重點關注的要素,除了試題的品質和數量,其次就是考生作答的時間,二者相匹配才是一場成功的考試。假如一場原本2個小時的考試,大部分考生一小時內就交卷了,就說明題目的設定不合理。反過來,如果大部分考生都答不完題,最後的題目考生連作答機會都沒有,那麽這些就是廢題。

只有更精確的、更細致的資訊才能優化考試的內容,這樣才能保障了“考試本身的品質”。

國際考試最堅定的推行者是托福考試,得益於很早就普及了機考,它建立了一個非常科學的題庫和卷庫。大部分考生在連續幾次考試中,分數的差別都不會太大。趙署秋表示,在紙筆考試和機器考試做對比的時候,機器考試的誤差度是最小的。

但並不是所有人都支持紙筆考試向機考轉化。擔憂者認為,ACT 考試的5個項目共215分鐘,這意味著大家要面對電腦連續做題近4個小時的題,要求考生習慣在電腦上進行長時間的閱讀;其次,它對於考試的打字速度也有要求。

劉君則告訴鈦媒體,在美國本土,有一部分人是十分反對機考趨勢的,原因在於,學校和社會都在倡導學生們要少用螢幕,少使用電腦和手機,現在改成了機考,“很多考生表現出了極大的不適應,跟主流倡導的教育觀念其實是有點違背的。”

紙質書本閱讀的習慣在美國很普遍,學校教育也鼓勵學生深度閱讀,“機考”這件小事,或許是如今這個螢幕時代留給教育界的一個課題。(本文首發鈦媒體,作者/李程程)

獲得更多的PTT最新消息
按讚加入粉絲團