中央情报局的分析专家其实对今天的DEEPSEEK现象的出现,早就有预言

美国老师
楼主 (文学城)

由于缺乏最先进的计算机系统,苏联人被迫依赖更巧妙的理论方法来进行计算,获得精确的效果。

 

“苏联人常常以解析形式给出复杂的理论问题解决方案,而美国通常依赖计算机数值计算解决方案。在流体动力学领域就存在这样的例子,苏联人通过巧妙选择边界条件、运用巧妙的数学技巧或高效编程,在性能远低于美国计算机的设备上得出了精确的计算结果。”

 

中国人工智能的突破正在动摇西方在这场技术军备竞赛中的主导地位,这让人不禁将其与苏联最伟大的成就之一进行比较。

 

Marc Andreessen warns Chinese ChatGPT rival DeepSeek is ‘AI’s Sputnik moment’

BYChristiaan Hetzner

January 27, 2025 at 9:00 AM EST

 

美国媒体认为以说是比中国第六代战斗机更大的斯普特尼克时刻(苏联第一颗卫星发射,美国人被震撼)。

DeepSeek深夜发布开源多模态人工智能模型Janus-Pro-7B。

DeepSeek冲击美股,英伟达收跌近17%,单日市值蒸发近6000亿美元,规模创美国股市史上最大。英伟达称DeepSeek是“卓越的人工智能进步”。

 

以不到600万美元的投入和2048块低性能的H800芯片的条件下完成的,训练时间仅用两个月。这种“四两拨千斤”的模式,颠覆了人们对OpenAI“大力出奇迹”式的固有认知,结果令全球侧目。

 

DeepSeek出现,以美国OpenAI十分之一不到的成本就训练出比肩他们、甚至很多方面更好的结果。这个性价比太高了,哪怕你只有90%结果,一半价格都有人用。现在是一样效果,购买十分之一价格不到。难怪媒体报道说,整个美国科技界,乃至全球掀DeepSeek复现狂潮!网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现,只用强化学习,没有监督微调,30美元就能见证「啊哈时刻」!全球AI大模型,或许正在进入下一分水岭。

 

而这个结果对美国那些AI投资大量成本的公司是毁灭性的。他们的商业闭环被干翻了。而且还能用华为昇腾910B跑,性能只是损失5%,成本下降70%。

 

另一个神话就是必须欧美才会创新。这次创新群体全部是国内高校培养的本土学生。工作年限小于8年。其中不乏应届生、实习生。在这里,工作经验不再是衡量人才的唯一标准。DeepSeek的HR在社交媒体平台表示,“着重考察人选素质和对大模型的热爱”。“投身于探索 AGI 的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题”。

 

zt

方外居士
关于过去苏联寻求解析解以弥补算力不足:据说中国以前也是这么做的!
蒋闻铭
在苏联崩溃的时候。老毛子的数学,也强过美国。在我的领域(动力系统),领先美国二十年。:)
美国老师
只要帝国算力发起进攻,那么一切就会好起来的。一根针捅破了一个气球
十具
科技史上,中国人的弱势恰恰是在数学和理论方面,但工程方面的直觉和技巧极强。深度求索的方法多半是蒸馏学习,把现有知识用到极
老财主说两句
让子弹飞一会儿,现在下结论还太早。对开源程序的改进,别人也在继续改进
十具
这就是为什么越战中,美军飞行员嘲笑萨姆地空导弹是会飞的电线杆子。笨重萨姆的飞控靠苏联世界一流的控制论,而不是微电子。中国

各大学至今还保留所谓的自控系,其实它们与CS,EE早就没有什么区别了。

哪一枝杏花
老毛子的数学,只在数学理论上好过美国,其他并没有
方外居士
把控制论和微电子对立起来,这是什么学问?
十具
无微电子就无微型灵巧的数控和传感。SA-2地空导弹3层楼高(10.7m),2.4吨重。如此笨重还能被地面无线指令制导,多

多亏了苏联控制论应用的水平精湛。

z
zhenleilren1
竞技场上你追我赶是常事。如果成本真如所说,DS的最大意义就是伤了硅谷大厂们的心,还记得美国航天局一百多万开发太空笔的传说
十具
互联的智能化的微器件,能大大简化控制任务和算法,并使得整个系统集成度更高更小型化。比导弹控制更精密的应用多了去了。
衡山老道
可能还有其它优化。