从柯洁到DeepSeek，都是大脑双系统的经典案例 - 2025年1月28日北美华人网存档

7 个月

楼主 (北美华人网)

当柯洁一次又一次的把棋子放到盖子外，很多人都会问，为什么他就不能控制自己。因为，他从小每天一遍又一遍的训练，围棋比赛，在他的大部分走棋中，也是一种快速，大致的动作。他会用极端的时间思考走棋，然后在对手思考的，跟着一起思考。棋是随手放的，不是重要的东西，一个习惯而已。所以他改不了。其实，这就相当于你骑单车，你骑单车的时候，是不会考虑是怎么骑的。就像DeepSeek，为什么他更快，更省电？
这一切，都要从衡水中学早上5点半说起，每天早上，晨读和练习，将伴随衡水中学的学生一天，几乎不让人思考，他们会像机器一样在某个时间跑步，某个时间吃饭，某个时间和其他同学简单娱乐。也许有人很鄙视这种每天重复的练习数学题，填鸭式的教育扼杀了人的创造力。但是，经过千百遍的训练，学生可以对普通数学题，非常快速的，准确的给出大概答案，然后再静下来稍微验证，答案就出来了。相当于，每个大陆来的人给自己小孩教数学极为痛苦，因为15+30，这种数学题对我们来说，答案就那里，但是美国长大的小孩，恨不得用一张纸把格子都画出来，因为手指不够用了。
在丹尼尔·卡尼曼在《思考，快与慢》，人的思维分为两种，系统1，系统2. 其中系统1，就是我们习惯性的刷题，最后给你那种题感，手感。美国人很少用于学习，这种感觉但是普遍存在于篮球，足球中。科比每天要投几千遍，为的就是整个手感。系统2，就是系统的，理性的思维，逻辑缜密，一丝不苟，但是非常慢，当然，思考也容易创造。
从这里开始，也就造成Chat Gpt和DeepSeek，很多美国的白人研发人员，他们没有精力也没体会过一天到晚刷题阶段，他们不认为重复刷有什么意义。但是衡水中学的懂，刷多了，就快了。而DeepSeek，也是巧妙的利用这一点，任何问题，都通过系统1模式，快速找到大致答案或者方向，但是这个系统1，真的就是通过衡水模式，一遍又一遍的不断加强。这个过程并不是为了多么准确，就是为了快速，省电，省资源。最后采用系统2去验收，就相当于题海战术最后一步，验证。
正因为，研发人员从小学开始的认知不同，造就了Chat GPT和DeepSeek的不同有个小知识：MIT实验室的功能磁共振成像揭示了一个认知鸿沟：中国学生在心算时激活的脑区面积仅为美国同龄人的1/3。这种差异源于海马体与前额叶皮层的神经重构——经过3万次重复训练的神经网络，已形成类似骑自行车时小脑运动协调功能的"数学直觉"。正是这种认知压缩技术，使得DeepSeek在同等算力下实现代码生成速度达到ChatGPT的2.3倍，而能耗仅为其37%。
33% 和 37%，大家觉得是巧合吗，非常接近? 其实DeepSeek就是一个小镇做题家，他的心算水平比Chat GPT快。

chainshore

7 个月

小镇做题家很寂寞呢，问个coding问题，给了需要划屏30秒才能刷到底的解释，大段心路历程，我都醉了对比chatGPT直接给了几行code和几点解释，两边给出来的解决方法，interestingly倒是不一样我最后用了chatGPT的solution，没有验证小镇做题家的方法行不行得通

minqidev

7 个月

小镇做题家很寂寞呢，问个coding问题，给了需要划屏30秒才能刷到底的解释，大段心路历程，我都醉了对比chatGPT直接给了几行code和几点解释，两边给出来的解决方法，interestingly倒是不一样我最后用了chatGPT的solution，没有验证小镇做题家的方法行不行得通
chainshore 发表于 2025-01-28 08:45

, R1只是一种秀，告诉你他怎么思考的，相当于你在让DeepSeek做题。他们现在还在做题。你问的任何问题，他依然在训练。他们也可以不回复那么多。
我用了R1做了稍微复杂的项目，Deepseek，编程非常厉害，特别是大文档，多文件的。

23urfur12

7 个月

楼主提到的系统1，是不是就是类似肌肉记忆这种，比如画画，拿起笔就知道轻重缓急，这个确实是要大量枯燥的练习才能达到，跳过这一步，直接谈构图色彩技法，也成不了画家，但是可以当个评论家。做实践的，这种肌肉记忆，好像确实是必须的。

minqidev

7 个月

楼主提到的系统1，是不是就是类似肌肉记忆这种，比如画画，拿起笔就知道轻重缓急，这个确实是要大量枯燥的练习才能达到，跳过这一步，直接谈构图色彩技法，也成不了画家，但是可以当个评论家。做实践的，这种肌肉记忆，好像确实是必须的。
23urfur12 发表于 2025-01-28 09:40

就是肌肉记忆，我只是猜想，他们省能源，是通过模仿系统1实现的。
我无意中找到了中美学生，心算大脑皮层使用率，中国学生是美国学生的33%，其实和deepseek与chat gpt之间的能源比相近，我觉得可能deepseek有更多的训练去模仿系统1.

mjtalk

7 个月

中文讲厚积薄发，融会贯通，就是积累到一个点就突然悟道了。所以我认为创造力和训练是两方面相互成就的。比如毕加索这样的天才，实际上经过严格的传统绘画技法的训练，体育项目也是这样，我相信数学家也不是从小就整天坐在家里凭空想象，也会一直在学习一直在解题

mjtalk

7 个月

chainshore 发表于 2025-01-28 08:45
小镇做题家很寂寞呢，问个coding问题，给了需要划屏30秒才能刷到底的解释，大段心路历程，我都醉了对比chatGPT直接给了几行code和几点解释，两边给出来的解决方法，interestingly倒是不一样我最后用了chatGPT的solution，没有验证小镇做题家的方法行不行得通

你可以不看思考过程，把Deep Think (R1)那个选项去掉，就可以直接得到coding的答案