总编专栏
“高分通胀”的背后是教育的悲剧
文 / 陈志文
2020-08-03
选拔性考试变得越来越水平化、简单化,甚至模式化,高分考生越来越多。

  这本是《光明日报》的一篇旧文,看到今年的中高考成绩,觉得有必要再次反省这种高分考生越来越多的现象,稍加修改再次发表。

  今年中高考分数公布,和我们预设的疫情影响分数下降的场景不同,各地高分考生纷纷井喷。

  北京中考满分580分、570以上的考生创造了纪录,超过1400余人(一说1300余人),而去年仅有9人。高考也一样,700分以上达到了80人,而2019年仅有24人。中高考都创下了历史最高纪录。

  不止是北京。上海中考考生总量约8万人,数学成绩在141-150(150)分的有26988人,136分以上的总数达到3.78万人,几乎逼近所有考生的一半。英语成绩在141-150分的高达15985万人,136分以上的也高达3万多人。

  在河南,高考600分以上的考生达44162人,700分以上考生169人,但2019年高考状元也仅有702分。在河北,600分以上考生也超过了3万人,700分以上106人,均大幅提高,创造了历史最高纪录。

  都是高分考生,分数的筛选价值越来越微弱,也不断加剧着分数的竞争,已经不再是分分计较,中考甚至是零点几分的计较。

  选拔性考试变得越来越水平化、简单化,甚至模式化,高分考生越来越多。

  以前的中高考不是这样的,作为一项选拔性考试,其区别度还是显著的。也就是说,学业优秀与否,分数差距是很大的,第一名与第二名之间差距也不小。在中高考中,满分是极其稀缺的,能有一两个人或者几个人已经了不起了。但现在,想当第一名,恨不得要求你门门是满分或者逼近满分。

  为什么会这样?

  总体上原因比较复杂,在我看来,大体有五方面的原因。

  第一,把考试难度与负担强行挂钩,一直试图通过降低考试难度来减负。

  第二,求稳成为各地中高考的核心政治诉求,民意诉求,导致中高考考试不断模式化,考试内容与题型甚至大面积固化。

  第三,与招生改革的指导思想有关,相关部门一直希望以水平测试替代选拔性考试,破解应试教育,破解对分数的追求。

  第四,家长对学生教育投入的重视,应试教育发达,客观上也导致水平也在提高。

  第五,随着高等教育与高中教育的普及,中高考不得不承担更多的水平测试的职能,不得不部分水平化。当然,今年疫情备考不充分,让各级考试在命题上也不得不适当下调了难度,这是今年的特殊情况。

  这里面有客观原因,比如面对高中与高等教育普及化,不得不承担把所有考生评测出来的职能。但也有一些非客观原因,更值得深入探讨。

  首先就是把考试难度与负担强挂钩。

  上世纪90年代以来,舆论与大众对以高考为代表的升学考试口诛笔伐,无限上纲上线,指责大学教授也不会做什么题之类的标题比比皆是。考试试题难度被认为直接影响甚至决定学生的负担,试题难度大,压力就大。在这种错误的舆论压力下,各级选拔性考试不断退让,追求稳定,降低难度。中高考试题因此越来越趋于模式化,甚至固化,“万年不变”的送分题越来越多,考基本智商的题比比皆是。中高考越来越像托福、雅思等水平化考试,越来越远离选拔性考试。

  这是近年来各类升学考试中值得注意的一个趋势,其背后无非是一个荒唐的逻辑:试题难度与学生负担成正比,为降低负担而不断降低难度。

  其实,考试的难度与负担之间没有必然联系,这是一个浅显的基本逻辑,基本道理。如果谈到负担,其实只与你考试的期望值相关联。再简单的考试,想考第一都是比较难的,再难的考试,想考零分都是很容易的,而非试题的难度。但遗憾的是,很多人把这个逻辑颠倒了。

  这一现象,还与我们近年一些招生改革的思想有关,与倡导甚至照搬英美的招生录取方式有关,推行选拔性考试水平化、等级化,试图以水平测试破解应试教育难题。

  不同的考试,其定位与目的,效果和作用是不同的,简单从功能上来说,一种是水平考试,一种是选拔性考试。原则上讲,水平考试难度相对较低,从测量角度看,区分度较低,是粗颗粒的,只是一个大致分层。但是选拔性测试不同,它更强调对优秀人才的区别与选拔,要求区分度更高,是细颗粒的。

  我们所熟知的美国的各种考试多数是前者。美国“高考”SAT实际上相当于我们的高中学业水平测试,美国的“中考”SSAT类似我们初中学业水平测试,同样,托福也是一种语言水平测试。这类水平测试在分数的计量上也是不同的,比如老SAT满分为2400分时,即便再低,一般也不会低于1200分,想低于这个分,稀缺度和考2380分以上一样难,因此经常有人开玩笑说:你如果SAT能考到1100,我就请你吃饭。

  美国盛行的这种水平化考试,是与其录取制度配套的,即水平考试作为一个基础学术评价,学校在此基础上综合评价后招生录取。这些成绩是基础,但不是唯一依据。

  中国则不然。因为诚信等原因,最后不得不回到分数这个唯一的刚性依据上来,这时,盲目套用美国的水平测试,那几乎是一场灾难。人家用一个粗框架的水平测试作为一个评价基础,我们却需要把这个东西作为唯一,怎么能不出问题?

  近日江苏文科第一名(严格讲并非第一名),因为历史科目B+无缘北大清华就是这个原因。其实按江苏的规则,她无缘大部分的985高校,不止是清华北大。

  2008年江苏高考改革,考试上的基本模式就是选拔性考试(语数外)+水平测试。这一分裂的混搭组合,目的是降低分数的残酷竞争,但却造成了更多的混乱,不得不废弃。

  除此之外,我们的考试越来越简单,还有一个潜在原因,搞“分数GDP”,让多数考生与家长都有分数的获得感,皆大欢喜。比如某市曾经在一年之间就让高考分数平均分上涨了100分左右。

  近年各地在“分数GDP”的竞争上也越来越激进,尤其是中考,几乎一个比一个容易,无法区分。越来越多的人是高分考生,家长学生脸上都有光。这个做法很有点消灭薄弱校的做法,挂牌子,改名字,于是大家都名校,皆大欢喜。

  如果这样的做法是可行的,对人才选拔与培养有利,没有什么不可以,但遗憾的是,多数是适得其反。

  考生的成绩越来越高,表面上家长和孩子都皆大欢喜,岂不知害苦了教育。

  首先,考试简单化、水平化、模式化,大大降低了考试的区分度,完全破坏了选拔人才的功能,带来了更激烈的分分计较。

  我们虽然不断推进招生改革,包括综合素质评价,但因为诚信等种种现实困难原因,在公平强大的诉求下,综合素质评价只能是“一参考”,最后升学考试多数还是要回到分数这把刚性的尺子上来。这时,分数之间的竞争更加激烈,已经不再是分分计较,而是零点几分的计较。1分2分有区别吗?当然没有。破解分分计较的办法,带来的却是更残酷的零点几分的计较。

  更糟糕的是,考试越来越水平化,甚至固化,分数越来越高,区分度越来越低的分数,对于人才选拔的意义越来越小,尤其是对拔尖人才,甚至起反作用,选拔出的更多可能是中间人才,未必是顶尖人才。

  这也导致一些名校不得不放弃依赖高考分数的选拔,越来越多地走特殊类型招生,希望通过其他尺子,弥补缺乏区分度的尺子。自主招生近年大行其道就是这个原因。

  近年著名高校在浙江搞的三位一体,表面上是综合评价,即60%是高考分数,10%是中学评价,30%是学校自己的评价。但核心还是需要靠高校自己的笔试与面试做一次再甄别,以选拔出最优秀的。

  2019年,在清华大学三位一体测试考场,很多考生提前交卷,一个关键原因就是题目难度,考生自知没戏,索性提前交卷准备下午其他学校的测试。有一个女生面对记者提问时说:真难,题型都没有见过。其实,这句话可以反向理解:高考的题型与内容都是见过的。

  近年各地高考状元普遍不再来自当地名校,呈现全面分散化的现象,有人高兴地认为这是优质教育资源均衡的结果,岂不知这是考试简单化、水平化的结果。这种低难度,水平化甚至固化的测试,最后较量的是熟悉程度,是谨慎不出错,拼的不是能力,而是不丢分。因此,更多的人都有可能胜出。

  这种升学考试,最后褒奖的不全是最优秀的人,多数是最擅长刷题的人。对于极其优秀的学生,反而增加了大量无效负担,为了几分的区别,很多孩子不得不花上一年甚至更久的时间重复训练,才能确保进入一个理想的学校。从这个角度上看,这种考试,恰恰是对优秀学生增加了无效负担。

  其次,与各级考试难度下降,考试模式化、固化相伴,在应试教育的现实状况下,各地也出现了学生学业水平下降的新问题。

  这方面最典型的案例,莫过于江苏的2008年高考模式。2008年江苏的高考考试改为语数外(不分文理)+水平(等级)测试。前面的还是选拔性考试,后面的测试则直接表述为A+,A等。这个方案的出发点非常理想,也很可爱。

  这个方案引起各方非议只是一方面,比如今年所谓文科第一名无缘北大清华的结果。更糟糕的是,水平测试带来江苏考生在物理等等级测试科目上水平的大幅度下滑。

  北京某著名大学对江苏生源的长期监测表明,原来数学物理成绩遥遥领先于全国,高居该校第一名的江苏生源,2008年新高考后,数学物理成绩下降显著,尤其是物理,在实施新高考5年后,江苏考生的物理成绩在学校新生摸底测试中,从第一名跌至第19名。

  其根本原因就是考试的模式,语数外不分文理,数学难度不得不降低,而后面的更彻底是非常粗颗粒的水平(等级)考试,难度大幅下降。考的简单了、少了,学生学的就少了,导致江苏考生在这些学科上的水平大幅度下滑。因此,该校近些年对于江苏考生不再像以前那么青睐了。

  功利文化是弥漫性的,一旦考试这个指挥棒简单了,学的就必然少了,从这个角度说,从为国家人才培养的角度看,我们需要高度警惕,中高考考试水平化,简单化,是否会带来人才培养质量的普遍下降?

  最后,如果说区分度降低,难以选拔出优秀人才还可忍受的话,那么选拔性考试简单化、水平化、模式化,则直接强化推动了应试教育的发展,这是我们坚决不能接受的。

  一方面推动中高考等选拔性考试逐渐水平化,简单化,另外一方面,为了追求所谓的平稳,命题不得不模式化,甚至固化,各地中高考所考核的知识点与题型大多连年保持不变,这几乎等于考试试题三年早知道。对于理科科目,区别只是切入点与参数的变化。

  要保证在这种考试中脱颖而出,关键在于不出错,怎样才能做到这一点?训练,连续不断的重复训练,因为重复训练是最有效的,这也就是全国弥漫性的应试教育难以根除的重要原因之一。

  我曾在某地一所重点中学看到一个班训:作业按时交,必上211。这个班训鲜活地反映了目前考试的特点或者说不足。考什么,其实大家都知道,核心是扎实训练,不出错,因为这种重复训练是有意义和有效的。

  衡水中学等地方中学全面崛起,虽然有多种原因,但其中一个原因就在于这种考试模式,让扎实的重复训练有了重大意义。这可能是一些专家在批判考试难时始料未及的。

  同时,区分度降低,也前所未有地强化了分数的价值,分分必争成为一个普遍而现实的问题。即便是在北京,考生不足7万人的情况下,一个高分分数段有几十人甚至上百人比比皆是。

  在一些考生大省,比较高的分数段1分动辄200-300百人,甚至近千人,而一所高校在当地招生量才有多少?反观低分分数段,1分段往往只有几个人。最后推动的只能是应试教育的加剧。

  在我们还无法全面推行综合素质评价,对于大多数人只能以考试成绩为核心录取依据的背景下,这种选拔性考试水平化、固化,恰恰强化了应试教育。毕竟,刷题是管用的,效果是明显的,就如托福、GRE一样。

  中高考越来越容易,无意间也抬高了更多家长与考生的期望值,加剧教育的剧场效应。

  中高考分数全面上涨虚高,表面上皆大欢喜,大家都收获满满成就感、获得感,但也误导了很多的家长与学生,人是有区别的,尤其是中考虚高,导致很多家长与考生对自己做出误判,无意间推升了教育的期望值。

  中考分数几乎没有区分度的情况下,人大附中与其他中学的录取分数几乎没有区别,于是让很多家长误以为自己孩子很优秀,一不留神没准就能上北大清华,于是拼命上补习班,希望把最后一公里补上来,客观上反而加剧了家长的期望,进而推动了教育的剧场效应。

  因此,中高考难度加大,拉开差距后,一个积极的意义就是让一部分家长与考生有清醒的认知,选择适合自己的道路,而不是拼命补习、训练,全部追名校。新加坡在这方面的做法给了我们很好的启示,从小升初考试开始,就让一批家长彻底放弃了精英道路的追求。

  升学考试这种选拔性考试简单化、水平化,在还不能全面推行综合素质评价的背景下,对中国教育是弊大还是利大?在我看来,答案是明确的。

  是时候采取措施予以纠正了。中高考试题要打破水平化,简单化,甚至固化的倾向,加强区分度。尤其是打破固化的倾向,每年试题无论考核的知识点还是出题形式上,需要加大变化,最大程度减少重复率,让所有人无试可应,反而可以最大程度降低应试教育,减轻学生负担。

  试想,如果试题难度加大,没有了太多“万年不变的题”,无试可应时,还会出现大面积应试吗?大家都乖乖回头去学习了,而不是刷题。

  最后还想提醒,考试无论容易还是难,对所有考生都是公平的,所有的家长和学生都不必焦虑。

简介
陈志文,中国教育在线总编辑,多年重点从事教育改革与治理研究。
联系
手 机 扫 码 查 看