从柯洁到DeepSeek,都是大脑双系统的经典案例

m
minqidev
楼主 (北美华人网)
当柯洁一次又一次的把棋子放到盖子外,很多人都会问,为什么他就不能控制自己。 因为,他从小每天一遍又一遍的训练,围棋比赛,在他的大部分走棋中,也是一种快速,大致的动作。他会用极端的时间思考走棋,然后在对手思考的,跟着一起思考。棋是随手放的,不是重要的东西,一个习惯而已。所以他改不了。 其实,这就相当于你骑单车,你骑单车的时候,是不会考虑是怎么骑的。就像DeepSeek,为什么他更快,更省电?
这一切,都要从衡水中学早上5点半说起,每天早上,晨读和练习,将伴随衡水中学的学生一天,几乎不让人思考,他们会像机器一样在某个时间跑步,某个时间吃饭,某个时间和其他同学简单娱乐。 也许有人很鄙视这种每天重复的练习数学题,填鸭式的教育扼杀了人的创造力。但是,经过千百遍的训练,学生可以对普通数学题,非常快速的,准确的给出大概答案,然后再静下来稍微验证,答案就出来了。 相当于,每个大陆来的人给自己小孩教数学极为痛苦,因为15+30,这种数学题对我们来说,答案就那里,但是美国长大的小孩,恨不得用一张纸把格子都画出来,因为手指不够用了。
在丹尼尔·卡尼曼在《思考,快与慢》,人的思维分为两种,系统1,系统2. 其中系统1,就是我们习惯性的刷题,最后给你那种题感,手感。美国人很少用于学习,这种感觉但是普遍存在于篮球,足球中。科比每天要投几千遍,为的就是整个手感。 系统2,就是系统的,理性的思维,逻辑缜密,一丝不苟,但是非常慢, 当然,思考也容易创造。
从这里开始,也就造成Chat Gpt和DeepSeek,很多美国的白人研发人员,他们没有精力也没体会过一天到晚刷题阶段,他们不认为重复刷有什么意义。但是衡水中学的懂,刷多了,就快了。 而DeepSeek,也是巧妙的利用这一点,任何问题,都通过系统1模式,快速找到大致答案或者方向,但是这个系统1,真的就是通过衡水模式,一遍又一遍的不断加强。这个过程并不是为了多么准确,就是为了快速,省电,省资源。最后采用系统2去验收,就相当于题海战术最后一步,验证。
正因为,研发人员从小学开始的认知不同,造就了Chat GPT和DeepSeek的不同 有个小知识:MIT实验室的功能磁共振成像揭示了一个认知鸿沟:中国学生在心算时激活的脑区面积仅为美国同龄人的1/3。这种差异源于海马体与前额叶皮层的神经重构——经过3万次重复训练的神经网络,已形成类似骑自行车时小脑运动协调功能的"数学直觉"。正是这种认知压缩技术,使得DeepSeek在同等算力下实现代码生成速度达到ChatGPT的2.3倍,而能耗仅为其37%。
33% 和 37%, 大家觉得是巧合吗,非常接近? 其实DeepSeek就是一个小镇做题家,他的心算水平比Chat GPT快。
c
chainshore
小镇做题家很寂寞呢,问个coding问题,给了需要划屏30秒才能刷到底的解释,大段心路历程,我都醉了 对比chatGPT直接给了几行code和几点解释,两边给出来的解决方法,interestingly倒是不一样 我最后用了chatGPT的solution,没有验证小镇做题家的方法行不行得通
m
minqidev
小镇做题家很寂寞呢,问个coding问题,给了需要划屏30秒才能刷到底的解释,大段心路历程,我都醉了 对比chatGPT直接给了几行code和几点解释,两边给出来的解决方法,interestingly倒是不一样 我最后用了chatGPT的solution,没有验证小镇做题家的方法行不行得通
chainshore 发表于 2025-01-28 08:45

, R1只是一种秀,告诉你他怎么思考的,相当于你在让DeepSeek做题。他们现在还在做题。你问的任何问题,他依然在训练。他们也可以不回复那么多。
我用了R1做了稍微复杂的项目,Deepseek,编程非常厉害,特别是大文档,多文件的。
2
23urfur12
楼主提到的系统1,是不是就是类似肌肉记忆这种,比如画画,拿起笔就知道轻重缓急,这个确实是要大量枯燥的练习才能达到,跳过这一步,直接谈构图色彩技法,也成不了画家,但是可以当个评论家。做实践的,这种肌肉记忆,好像确实是必须的。
m
minqidev
楼主提到的系统1,是不是就是类似肌肉记忆这种,比如画画,拿起笔就知道轻重缓急,这个确实是要大量枯燥的练习才能达到,跳过这一步,直接谈构图色彩技法,也成不了画家,但是可以当个评论家。做实践的,这种肌肉记忆,好像确实是必须的。
23urfur12 发表于 2025-01-28 09:40

就是肌肉记忆,我只是猜想, 他们省能源,是通过模仿系统1实现的。
我无意中找到了中美学生,心算大脑皮层使用率,中国学生是美国学生的33%,其实和deepseek与chat gpt之间的能源比相近,我觉得可能deepseek有更多的训练去模仿系统1.
m
mjtalk
中文讲厚积薄发,融会贯通,就是积累到一个点就突然悟道了。所以我认为创造力和训练是两方面相互成就的。比如毕加索这样的天才,实际上经过严格的传统绘画技法的训练,体育项目也是这样,我相信数学家也不是从小就整天坐在家里凭空想象,也会一直在学习一直在解题
m
mjtalk
chainshore 发表于 2025-01-28 08:45
小镇做题家很寂寞呢,问个coding问题,给了需要划屏30秒才能刷到底的解释,大段心路历程,我都醉了 对比chatGPT直接给了几行code和几点解释,两边给出来的解决方法,interestingly倒是不一样 我最后用了chatGPT的solution,没有验证小镇做题家的方法行不行得通

你可以不看思考过程,把Deep Think (R1)那个选项去掉,就可以直接得到coding的答案