每日最新頭條.有趣資訊

PISA測試中國成績大幅度下降,到底能說明什麽?

中國學生在2009、2012年連續取得PISA測試總成績第一的佳績,為何在2015年成績劇烈下滑?這背後究竟是什麽原因?

作者:郭山

編 | Luna

前段時間,我分析過IMO(國際數學奧林匹克競賽)中國隊成績下滑背後所反映的一些教育問題。其實,還有一項比IMO規模更大、樣本更全、參考價值更高的國際性學生學習能力測試,即PISA測試。

該測試才是全面反映各個國家基礎教育真實水準的“金標準”。一年前,筆者曾在一篇長文中對PISA測試中國成績下滑做了簡單分析。現在把該部分摘錄出來,補充更多數據、材料和分析,可以從另一角度繼續觀察中國基礎教育存在的真實問題。

什麽是PISA測試

百度:PISA(Programfor International Student Assessment)(國際學生評估項目的縮寫)是一項由聯合國經濟合作與發展組織(Organization for Economic Co-operation and Development,OECD)統籌的學生能力國際評估計劃。主要對接近完成基礎教育的15歲(大致是初三、高一年齡段)學生進行評估,測試學生們能否掌握參與社會所需要的知識與技能。每三年舉行一次。

中國上海學生在2009、2012年連續取得PISA測試總成績第一的佳績,震動了國際教育界,不少國家來上海學習取經。英國BBC電視台還來中國錄製節目,“中式教育來了!”一時成為席卷西方的旋風。

2015年度的測試,由上海、江蘇、浙江、廣東四省的學生代表中國學生參加測試,總成績大幅度滑落到第十名(數學第6名、科學第10名、閱讀27名),一度引起輿論嘩然。

如下圖(紅框為中國位置),點擊可放大:

新加坡在三個項目上均取得世界第一;中國香港兩項第二,也不錯;日本、芬蘭、愛沙尼亞、中國台北、韓國、加拿大總成績也不錯。

2018年度的測試已經結束,成績尚未發布,此次測試中國參加的省份更多,預計成績不會樂觀。

PISA測試的方法

1. 參加PISA測試的每個國家抽取4500-10000名學生,樣本量較大,不像IMO(數奧)一樣只是6個學生。

2. PISA測試的樣本具有多樣性,包括市區、城鎮、農村不同地區;學校性質包括公立、私立;學校類型包括普通中學、職業中學、特殊學校;學校等級包括重點中學、普通中學、一般中學。樣本大,類型全,說明測試反映的是全體學生的整體平均水準,不像IMO(數奧)一樣只是頂尖學生。

3. PISA測試沒有考試大綱,也沒有測試題庫。測試學校隨機抽取,簽署試題保密協議,試卷回收;測試前一天下午才通知具體學校;每所被抽中學校並非全體學生都參加測試,而是隨機抽取該校一定數量學生參加。即學校和學生根本無法提前準備,也無法進行針對性訓練。不像IMO(數奧)一樣可以進行長期針對性集訓。

4. PISA測試的科目是三門:科學、閱讀、數學。所有用到的數學和理科公式都印在卷子上,題目類型主要是運用知識解決實際生活問題的能力(“接地氣”),而不是死記硬背的能力,卷子難度不大,基本能反映出學生的真實素質和綜合能力。不像IMO(數奧)一樣是高不可攀的難題。

5. 每個受測試學生的題目和其他同學都不完全一樣,基本可以排除作弊的可能。

結論:PISA測試結果反映的是學生運用知識解決真實問題的實際能力,也能反映出各國基礎教育的真實水準,可以說是檢驗各國真實教育水準的一把尺子。

PISA測試的真題是什麽樣子

看圖說話(看看就好,不要試圖解答):

其一、數學題舉例:

其二、閱讀題舉例:

下圖顯示位於北非撒哈拉查德湖的水深改變狀況。約在公元前20000年,最後一次冰河時期,查德湖完全消失了。直至公元前11000年它又再次出現。今湖水的深度仍然跟公元1000年大致相同。

下圖顯示撒哈拉岩石藝術圖(在山洞石壁上發現的古代圖案或圖畫)和野生動物的變化樣式。

依據前面有關查德湖資料,回答下列問題。

問題一:查德湖目前的湖水深度是多少?

A:約2米

B:約15米

C:約50米

D:它完全消失不見了

E:並沒有提供資料

問題二:圖一所描繪的圖片大約起自何年?

問題三:為什麽作者選擇這一年作為開始?

問題四:圖二是根據以下哪一項假設來製作的?

A:岩石藝術圖上的動物在繪製的時候就已經存在。

B:繪製動物的藝術家技巧十分高超。

C:繪製動物的藝術家曾到很多地方旅行。

D:沒有人想要飼養在岩石藝術圖上所描繪的動物。

問題五:收集圖一和圖二的信息回答:犀牛、河馬和野牛從撒哈拉意識藝術圖中消失是起於:

A:最近一次冰河時期開始時。

B:查德湖湖水最深的中段時期。

C:查德湖湖水深度持續下降已一千多年後。

D:不間斷乾旱時期開始時。

題目特點:真實場景、貼近生活、觀察思考、靈活運用,與書本知識有聯繫,但並非考察具體知識點的記憶。

如何看待學習負擔與PISA測試成績的相關性

請看下圖:學習時間和PISA測試成績的相關性研究。

上圖是2012年PISA測試成績和學生作業時間相關性的數據分析。橫坐標是作業時間,縱坐標是測試成績。

右上紅圈區:“煉獄區”。

屬於高測試成績,高作業負擔的國家和地區。包括上海(QC)、新加坡(SGP)、中國香港(HKG)。都是典型的東亞應試文化圈,但上海的作業負擔是新加坡的1.5倍,成績隻比新加坡略微高出一點;是香港作業負擔的2.3倍,但成績領先香港的幅度也不大。分析:作業數量達到一定數量後,邊際收益下降。

左上綠圈區:“天堂區”。

屬於高測試成績,低作業負擔的國家。包括日本(JPN)、韓國(kOR)、芬蘭(FIN)。尤其韓國和芬蘭,作業負擔僅是上海學生的五分之一。分析:在較低學習負擔情況下,學生學習能力一樣能獲得較好發展。提升成績更關鍵的是學習質量,而不是學習的數量。

右下藍圈區:“地獄區”。

屬於高作業負擔,低測試成績的國家。有俄羅斯(RUS)和哈薩克(KAZ),尤其是哈薩克。說明這些國家的基礎教育水準糟糕,是最差的一種結果:作業多還成績差。

左下紫圈區:“佛系區”。

屬於低作業負擔、低測試成績的國家,有巴西(BRA)、卡特爾(OAT)、突尼西亞(TUN)、阿根廷(ARG)、哥斯達黎加(CRI)等,以阿拉伯國家和南美國家居多。基本上孩子們隨意發展,自生自滅。

中央粉色區:“正常區”。

歐美發達國家處於作業較少,成績中上等的區間,不是理想狀態,但也不算糟糕。

PISA測試成績,中國成績的劇烈下滑,說明了什麽

2009年,2012年中國成績第一,為何2015年下滑到第十名?

分析:PISA測試成績反映的是參加考試學生的整體平均水準。對平均成績影響最大的不是頂尖學生,因為頂尖學生人數很少;對總成績影響最大的是中下等學生的成績,畢竟這部分學生的人數眾多。

第一、2009年、2012年兩次測試,中國參與測試的學生有數個省,但最後報送的成績僅僅是上海學生成績,上海基礎教育水準領先全國,取得好成績在意料之中。而且考慮到上海學生的作業負擔是第三名香港的兩倍以上,是日本、韓國的4到6倍,但成績相對日、韓,優勢並不明顯。尤其是與韓國相比,可說效率是很低了。

結論:相對於時間投入,上海的教育成果不值得沾沾自喜。

第二、2015年,中國參與測試和報送的成績是四個省市,成績下滑到第十名,這並不意外。前兩次中國是派出了自己的冠軍隊參加比賽,得了個世界第一;這一次有三個拖後腿的,成績下降在意料之中。需要提醒的是:這次參與測試的三個省江蘇、浙江、廣東,經濟文化和教育水準在國內還是不錯的。如果加入的省份是中西部身份,估計名次還會進一步下滑。這可能說明了一個事實:中國基礎教育的真正水準和質量,可能並沒有媒體渲染的那麽“扎實”。

延伸一

城市化對測試成績影響顯著

前兩次參加測試的上海學生幾乎都是城市學生(即便是上海郊區,也不是傳統意義上真正的農村),這一次有三個省大量的農村學生參加測試,拉低成績實屬必然。觀察參加測試國家的成績,不難發現,城市化水準高的國家和地區,同等條件下測試成績較高,如日本、澳門、香港、芬蘭。這說明城市化能顯著均衡教育質量。

延伸二

經濟基礎對測試成績影響顯著

即便是江蘇、浙江、廣東,整體基礎教育水準還是顯著落後於上海,說明在同等時間成本下,經濟基礎對教育水準的影響是顯著的。發達國家整體測試成績也不錯。

延伸三

文化傳統和生育率對測試成績影響顯著

重視應試和教育的東亞國家和地區(“儒家文化圈”)普遍測試成績領先,這些地區恰恰也是低生育率的地區,重視子女教育是全民行為。而中東、拉美國家的測試成績普遍偏低,可能和這些地區的民族文化傳統,采取“放養”教育模式有關,同時,這些地區生育率普遍較高,家庭對子女的教育投入相對不足。

延伸四

教育的均衡化水準顯著影響測試成績

芬蘭基礎教育均衡水準世界領先,學校規模小,城鄉差距微乎其微,沒有所謂的重點校,教育宗旨是“所有人的平等發展”,結果可能不利於頂尖人才的培養,但學生整體平均水準高,多次PISA測試成績領先也不意外。就國內看,上海的基礎教育均衡化程度高,超級學校和薄弱學校的差距不算太大,之所以整體總成績好,因為“拉後腿”的力度不大。2015年,新增加了三個省份參加測試,這三個省份教育均衡水準低,地區差距、城鄉差距、學校差距都很大,所以薄弱校和薄弱學生自然顯著拉低了整體測試成績。即便是上海,近年也出現了教育均衡化倒退現象,即優秀學生向部分民辦學校的過度集中。

總結:你不可能是全能冠軍,不必為PISA測試成績而過多焦慮。

PISA測試成績反映的是某地區學生的平均學習力,國家規模小、城市化水準高、低生育率、內部教育均衡的國家佔據明顯優勢。它並不能反映一個國家的綜合教育水準,更不能反映一個國家的頂尖教育水準,也不能直接對應一個國家的核心競爭力。

對於中國這樣一個國情複雜、人口眾多、城市化水準低、內部經濟教育差距大的超大型國家來說,獲得總成績第10名,其實已經遠遠高於中國人均GDP在世界上的排名。這個成績已經很不錯了。這充分說明了中國學生、教師、家長對教育的投入遠遠高於世界平均水準。也說明中國基礎教育相對較高的質量培養了大量價廉物美的勞力資源,這是四十年來中國經濟騰飛的最重要因素之一。

啟發和思考

*平均水準不代表最高水準,對於中國這樣一個欠發達的人口大國來說,辦幾所精英樣板學校並不難,提升整體教育水準才顯得真難。

*應該大力推進基礎教育均衡化,但不能以犧牲精英教育為代價。未來新技術時代國與國之間的競爭,傑出人才的培養比普通勞動者的培養或許更關鍵。

*提升學生學習成績,不能只靠延長學習時間。過分訓練不但會透支學習熱情,傷害後續學習能力,甚至也會導致現階段學習成績下滑。對於創新型精英學生來說,反覆重複學習、過度機械學習的傷害可能更大。

*提升普通學生學習成績,不能一味超前學習和加快學習進度。對於一般學生來說,學的“慢”才能學的“透”,看似知識進度“慢”,實際能力進度“快”。過快的節奏、超前學習(各類補習班),已經成為基礎教育積重難返的毒瘤,在成就部分傑出人士生同時,實際加劇了普通學生的學習困難。“因材施教”仍然是基礎教育面臨的真問題。

*教育的真正意義是提升解決真實問題的能力,而不是通過套路訓練獲得一個虛假的分數。以解題訓練和知識記憶為中心的教育模式,在人工智能、萬物互聯的新技術革命時代,早已不再是世界教育發展的主流,面對真實世界解決現實問題的教育應該是未來教育發展的方向。如果我們繼續固守傳統,因循守舊,必然會在不知不覺中落伍。畢竟,在人工智能面前,新型AI技術會輕而易舉消解我們勞動力的數量優勢。

*長期以來,我國基礎教育界不少人士以中國學生擅長“學習”,擅長“考試”,擅長“解題”沾沾自喜,認為中國基礎教育很“扎實”。現在看來,可能我們真正擅長的可能不是“學習”而是“複習”;不是“考試”而是“套路”;不是“解題”而是“刷題”。這樣的“學習”未必是真的學習。換了賽道和考場,我們可能就會一敗塗地。

*PISA測試的模式、機制、試題可以為完善中國的高考選拔制度提供很多有價值的參考。比如:不設考試大綱;沒有考試說明;考題和教材高度脫鉤、與生活緊密聯繫;沒有試題庫;不允許洩露考題;成立第三方命題機制和測評機制等。

附:一位參加PISA測試的中學“學渣”寫的感受,真實、自然、動人,值得每個教育者深思。

本文授權轉載自公眾號“隱蔽的歷史”

獲得更多的PTT最新消息
按讚加入粉絲團