高考: 出个题挑战平行, 其它有兴趣的网友也可以讨论

D
DuE
楼主 (北美华人网)
出个题挑战平行, 其它有兴趣的网友也可以讨论

活跃在Mitbbstw.com 的平行说话很高大上,常常提到top2, 斯坦福,大厂,高管,部长,高考高分等等;时不时讥讽他人就读不入流学校,思维不够缜密, 基础不够扎实等等。令人印象深刻。
她好像是清华ee加斯坦福ee的。清华ee的人我多年前偶遇一个, 聊起来,发现他不会,也没听说过过monte carlo方法。 这让我吃惊,因为印象中清华ee是很厉害的。 他不懂mc方法, 说明两点。1。清华的ee教育徒有虚名。2。他不太聪明。斯坦福的ee,也遇见一个,是我的dorm mate, 香港人。偶尔去访, 听他抱怨课程很难。看一下他的课本, 不像很难。 其他美国最top学校的中国学生,我知道的也很多, 大部分资质一般。那么,平行会是一个聪明的人吗?
我出个题给平行。我的题不是关于小波变换z变换,激波湍流,reinforcement learning等等, 是没有答案的, 也无法Google。它涉及到平行和mitbbstw.com 以及这里的网友乐于提到的,中国高考。
问题: 中国高考
中国的高考在甑别学力的功能上有重大的缺陷。比如, 常常听到一个平时成绩平凡的学生爆出冷门, 成为本县本市的状元。比如, 中国开改后最初两三批当选的美国俩院院士没有北清毕业的。比如北大数学系一年级每年都有三分一的学生数学分析不及格。这些都说明中国高考分数与学力有正相关, 但相关系数不像人们所assume 的那么大。
那么 问题来了,高考命题和判卷上有哪些明显的技术缺陷? 这里的明显不是指是个人都看得出来,而是指统计显著。
如果你能看出高考的技术上的缺陷, 就不会为自己曾经考上top2而沾沾自喜。也明白韩国日本把高考结果分成若干级, 级内不分高低的做法,是很科学的。 也知道高晓松高考排名全国第560名, 这个说法是经不起推敲的。
D
DuE
200 hits in 15 hours
D
DuE
D
DuE
回复 1楼DuE的帖子 关于高考 平行关于高考的评论是普通人的视野和语言, 没有训练有素的scientist 所具有抽象,建模,解析能力。管窥知豹,这个清华ee和斯坦福ee,不比我之前碰到的她的学长( 或  是学弟)高明。世上绝大部分人都平庸无奇, 包括许许多多从斯坦福哈佛麻省理工毕业的本科生研究生。我半辈子阅人无数, 华人中就张首晟还行。(我见到张时, 我们都还是翩翩少年。张西装革履,面如郎月,惊为天人。给我印象更深刻是当时当场写下gravitation那本书三个作者的全名。我至今可能还无法拼对那三个全名。) 当今世界, 智者云集的地方, 物理学中是superstring , 引力/规范duality,  数学中 是代数几何,计算机科学中的并不是DL, RL, 而是量子计算。ee排不上,不是智者角逐之地。(当然这并不妨碍个别ee出身的,现在在做量子计。)前不久,有一个声称十岁前要大学毕业的比利时小孩,他学的是ee,我就觉得fishy,果然没几天就漏怯。 一个聪明的孩子不会被ee所吸引,因为它缺乏美感。 言归正传。关于高考。每个考生的学力都有一个分布, 一场考试可以看成对每个考生学力分布的抽样, sampling. 一场设计良好的考试,一次抽样结果( 考生得分)就应该接近于分布的期望值(考生的hidden的真实水平)。 考生的真实水平对他们的老师来说是已知的, 是经过无数sampling 后,依据大数定律确定的。一拨学生根据平时成绩, 在老师那里有个排序。同一拨人,依据高考结果也有一个排序。这两个序列不尽相同。这两个序列越接近,高考甄别学力的功能越好。这里有个如何定义两个序列距离的问题。 高考命题设计是个最优化问题。就是要选择控制变量, 极小化这俩序列的距离(目标函数)。控制变量是各种题目的比重。每道题不只简单地分为难易, 还应该有更多指标。除了难易外, 还可以有长短(指耗时长短), 易错不易错。这三个指标大致独立。容易不一定耗时短。难题也未必耗时长。 比如, 一道多位数数字加减乘除的混算题(高考没有这样的题, 举例而已) 是容易, 耗时长, 易错。对学霸最有利的题是难,短, 不易错。 连接控制变量和目标函数的是考生行为。考生的行为由他们的做题策略决定。学生总体可以看成连续谱。 谱的一端是学渣, 他的答题方式主要靠猜。另一端是学霸, 按顺序每题必答完。(显然, 耗时长且易错的题对学霸是个坑。) 二者之间的有各种各样的答题策略。所以的策略都是先验决定的。 对考生来说,答题不是一个动态随机规划,因为他们得不到反馈,也无法看到实时结果。 这个最优化问题可以用simulation  -based optimization 方法解。答案是八种类型题目应该各占多大比例。如果没有意外的化, 应该是难题, 耗时长的题目比例为零。也就是说,美国那种标准化考试的命题方法最好。这个结果不惊艳。 虽然最优的结果可能很平白,但这个高考命题模型可以用来研究探索中国现有高考命题模式的各种问题, 各种命题scenarios  下的误差, 可以计算爆出各种冷门的概率, top2 里面学生的学力差距,北大数学系 三分之一读不懂数学分析的概率,等等。 问题没完。怎么对判卷过程建模? 先问一个问题,文理科试卷中的什么是主观题,什么是客观题?