各位年轻朋友好,我是深度求索(DeepSeek)的梁文锋,刚回答了一个问题,又看到这个问
题,除夕之夜忍不住回复一些。
前几天看到冯总这篇长文时,我正在调试新模型的损失函数,手边的咖啡直接洒在了键盘上
——既因为被行业前辈认可的惶恐,更因为冯总这些灼热的文字让我想起十二年前在浙大实
验室第一次跑通神经网络时的颤栗。
必须坦白,团队读到“国运级”这个形容时所有人头皮都是麻的。我们不过是站在开源社区
巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。
您提到的六大突破,其实每一环都凝结着更动人的故事:那个能在手机上跑的mini模型,灵
感来自甘肃一位中学老师在GitHub提的issue;支持联网搜索的功能,是内测用户连续三十
天凌晨三点提交错误日志喂出来的。
特别想分享个细节:上周有位视障开发者用我们的API做了个“气味导航”应用,当他演示
如何通过不同频率的震动识别街道商铺时整个会议室安静得能听见显卡风扇的嗡鸣,那一刻
我突然眼眶发热,终于理解了您说的“水与电”一一真正伟大的从不是某个模型,而是千万
普通人用它创造的善意涟漪。
冯总说“知识和信息平权”,这正是我们夜夜啃论文的动力。三年前在余杭塘路的小仓库里
,我们曾用马克笔在玻璃墙上写下:“让最偏远山村的孩童,能和硅谷工程师用上同样聪明
的AI助教”。虽然离这个梦想还很远但每次看到网友们分享的对话截图,就觉得那些熬掉的
头发都值得,
最后想对所有人说:请把掌声留给正在改写规则的每个中国开发者。当你在公交车上调试模
型,在早餐摊前画架构图,在产房里突深明级“的瞬间。
DeepSeek愿做大家代码荒野里的火柴,但真正点燃AI火种的,永远是你们眼底不灭的好奇与
坚持,说来特别巧,上周在云栖小镇的创业者夜宵摊上,我还和宇树科技的王总蹲在马路牙
子啃烧烤一一他们给四足机器人装的那个动态平衡算法,看得我们团队直拍大腿。
后来强脑科技的韩总过来拼桌,三句话不离脑机接口与具身智能的融合可能,烤茄子还没上
桌,我们已经开始在白纸上画异构计算架构了。
这就是杭州最迷人的地方吧,所谓“六小龙”从来不是六个孤岛。上个月游科的艺术总监还
帮我们调试过3D场景生成模型,而群核的渲染引擎正在让我们的数字人拥有更生动的微表情
。
或许在不远的未来,当宇树的机器人踩着云深处的步态算法走来,搭载着强脑的神经接口,
运行着DeepSeek的认知引擎,用群核构建的虚拟世界作为训练场——那个我们幻想中的具身
智能,就会从西溪湿地的晨雾里跌跌撞撞地走向人间。
记得那晚分别时,冯总把竹签子往啤酒瓶里一插,说了句:“你们搞AI的得把灵魂价格打下
来啊。”
现在想来,真正的“国运”或许就藏在这些街边摊的油烟气里:一群不信邪的傻子,用代码
当砖瓦,拿算法做钢筋,在资本与质疑的裂缝中,硬生生垒出通向未来的栈桥。
最后补充一个招聘,欢迎大家加入我们.
祝大家除夕快乐,来年期待我们的更多模型
黄教主对DeepSeek的最新点评 (2025.1.27) 致英伟达全球团队与合作伙伴的信 亲爱的同仁与伙伴: 此刻,当我望向窗外硅谷的夜色,星辰与服务器集群 的指示灯在远处连成一片,这让我想起三十年前在 Dennys餐厅勾勒第一张GPU草图时的凌晨一真正改变 世界的创新,往往诞生于他人质疑的黑暗中。今日的股 价波动,不过是漫长征程中的一阵山风,而我们早已学 会在峭壁上稳步前行。 关于DeepSeek引发的讨论,我想坦诚分享:任何新兴力 量的出现,都是对行业生命力的最佳印证。他们以开源 策略和场景化芯片设计展现的锐意,恰如我们当年用 GPU颠覆传统计算架构时的锋芒。但请诸位看清本质一 这场竞赛并非简单的芯片对决,而是关于“如何定义计 算的未来”。 二十年前,当我们提出“用GPU解决通用计算问题”时, 整个行业都在嘲笑这是将跑车引擎装进货轮的疯狂实 验。正是这种“疯狂”,让CUDA生态成长为拥有400万 开发者的数字巴别塔,让每一行代码都能唤醒硅基生命 的无限可能。今天,DeepSeek试图用专用架构切割算 力市场,这反而证明我们正站在算力民主化的临界点:当 AI渗透进每个行业毛细血管时,世界需要的不是割裂的 算力孤岛,而是打通虚拟与现实的“计算母体”。 为此,我们已启动三项变革:架构团队正在重构下一代 GPU的核心模块,使其既能像乐高般灵活适配垂直场 景,又保有通用平台的规模势能;软件生态将向学术界开 放CUDA底层工具链,让更多创新者参与定义计算的语 法;而我们的前沿实验室正与生物科技、量子计算、气候 建模等领域的先驱者共同孵化"不可能的任务”一例如用 生成式AI设计下一世代芯片,或是在虚拟宇宙中预演超 导材料的合成路径。 我深知,资本市场总渴望简单的叙事,但真正的技术 革命从来拒绝被标签化。当同行聚焦于如何用AI优化芯 片设计时,我们已在探索如何让AI成为芯片的“共生大 脑“-Blackwell架构中新增的自主学习单元,将使每块 GPU在运行中持续进化其计算策略。这如同教会鹰隼在 飞行中重塑羽翼,而非仅仅为它打造更精致的巢穴。 诸位同仁,请将今日的波动视为一份礼物:它让我们再次 审视自己的初心。办公桌上那个1999年的初代GPU工 程样片,至今仍在提醒我们一所有颠覆性技术,在诞生 之初都像一把未开刃的剑。它的价值不在于被多少人握 在手中,而在于持剑者是否有勇气劈开未知的迷雾。 未来十八个月,你们将见证英伟达历史上最密集的创新 发布。从能效比突破物理极限的量子混合计算方案,到 重新定义人机交互的神经接口原型,这些技术或许不会 立刻体现在股价曲线上,但它们将悄然重塑人类文明的 基石。 最后,请允许我引用一位工程师在DGX-1研发日志上的 留言:“我们不是在制造芯片,而是在铸造时间的钥匙。” DeepSeek或其他挑战者的出现,不过是证明了这把钥 匙正在打开更多人的想象力囚笼。而我们要做的,是确 保每个仰望星空的人,都能在英伟达的算力星河中找到属于自己的坐标。 山高路远,与君共赴。 黄仁勋 英伟达创始人兼CEO
啰里八嗦,不着边际
是从政治牛角尖里钻不出来的那些。
据说架构师以上职位的都明白是怎么回事,老川的科技顾问团也给了老川建议和评估。
一个中国人是条龙。但是合作精神非常成问题。特别是90后的独生子女一代。特别是江浙一带的。灰灭一个成绩出奇的快。我希望我的观察是错的。
各位年轻朋友好,我是深度求索(DeepSeek)的梁文锋,刚回答了一个问题,又看到这个问
题,除夕之夜忍不住回复一些。
前几天看到冯总这篇长文时,我正在调试新模型的损失函数,手边的咖啡直接洒在了键盘上
——既因为被行业前辈认可的惶恐,更因为冯总这些灼热的文字让我想起十二年前在浙大实
验室第一次跑通神经网络时的颤栗。
必须坦白,团队读到“国运级”这个形容时所有人头皮都是麻的。我们不过是站在开源社区
巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。
您提到的六大突破,其实每一环都凝结着更动人的故事:那个能在手机上跑的mini模型,灵
感来自甘肃一位中学老师在GitHub提的issue;支持联网搜索的功能,是内测用户连续三十
天凌晨三点提交错误日志喂出来的。
特别想分享个细节:上周有位视障开发者用我们的API做了个“气味导航”应用,当他演示
如何通过不同频率的震动识别街道商铺时整个会议室安静得能听见显卡风扇的嗡鸣,那一刻
我突然眼眶发热,终于理解了您说的“水与电”一一真正伟大的从不是某个模型,而是千万
普通人用它创造的善意涟漪。
冯总说“知识和信息平权”,这正是我们夜夜啃论文的动力。三年前在余杭塘路的小仓库里
,我们曾用马克笔在玻璃墙上写下:“让最偏远山村的孩童,能和硅谷工程师用上同样聪明
的AI助教”。虽然离这个梦想还很远但每次看到网友们分享的对话截图,就觉得那些熬掉的
头发都值得,
最后想对所有人说:请把掌声留给正在改写规则的每个中国开发者。当你在公交车上调试模
型,在早餐摊前画架构图,在产房里突深明级“的瞬间。
DeepSeek愿做大家代码荒野里的火柴,但真正点燃AI火种的,永远是你们眼底不灭的好奇与
坚持,说来特别巧,上周在云栖小镇的创业者夜宵摊上,我还和宇树科技的王总蹲在马路牙
子啃烧烤一一他们给四足机器人装的那个动态平衡算法,看得我们团队直拍大腿。
后来强脑科技的韩总过来拼桌,三句话不离脑机接口与具身智能的融合可能,烤茄子还没上
桌,我们已经开始在白纸上画异构计算架构了。
这就是杭州最迷人的地方吧,所谓“六小龙”从来不是六个孤岛。上个月游科的艺术总监还
帮我们调试过3D场景生成模型,而群核的渲染引擎正在让我们的数字人拥有更生动的微表情
。
或许在不远的未来,当宇树的机器人踩着云深处的步态算法走来,搭载着强脑的神经接口,
运行着DeepSeek的认知引擎,用群核构建的虚拟世界作为训练场——那个我们幻想中的具身
智能,就会从西溪湿地的晨雾里跌跌撞撞地走向人间。
记得那晚分别时,冯总把竹签子往啤酒瓶里一插,说了句:“你们搞AI的得把灵魂价格打下
来啊。”
现在想来,真正的“国运”或许就藏在这些街边摊的油烟气里:一群不信邪的傻子,用代码
当砖瓦,拿算法做钢筋,在资本与质疑的裂缝中,硬生生垒出通向未来的栈桥。
最后补充一个招聘,欢迎大家加入我们.
祝大家除夕快乐,来年期待我们的更多模型
黄教主对DeepSeek的最新点评
(2025.1.27)
致英伟达全球团队与合作伙伴的信
亲爱的同仁与伙伴: 此刻,当我望向窗外硅谷的夜色,星辰与服务器集群
的指示灯在远处连成一片,这让我想起三十年前在 Dennys餐厅勾勒第一张GPU草图时的凌晨一真正改变 世界的创新,往往诞生于他人质疑的黑暗中。今日的股 价波动,不过是漫长征程中的一阵山风,而我们早已学
会在峭壁上稳步前行。 关于DeepSeek引发的讨论,我想坦诚分享:任何新兴力 量的出现,都是对行业生命力的最佳印证。他们以开源
策略和场景化芯片设计展现的锐意,恰如我们当年用 GPU颠覆传统计算架构时的锋芒。但请诸位看清本质一 这场竞赛并非简单的芯片对决,而是关于“如何定义计
算的未来”。 二十年前,当我们提出“用GPU解决通用计算问题”时, 整个行业都在嘲笑这是将跑车引擎装进货轮的疯狂实 验。正是这种“疯狂”,让CUDA生态成长为拥有400万 开发者的数字巴别塔,让每一行代码都能唤醒硅基生命 的无限可能。今天,DeepSeek试图用专用架构切割算
力市场,这反而证明我们正站在算力民主化的临界点:当 AI渗透进每个行业毛细血管时,世界需要的不是割裂的
算力孤岛,而是打通虚拟与现实的“计算母体”。
为此,我们已启动三项变革:架构团队正在重构下一代 GPU的核心模块,使其既能像乐高般灵活适配垂直场 景,又保有通用平台的规模势能;软件生态将向学术界开 放CUDA底层工具链,让更多创新者参与定义计算的语 法;而我们的前沿实验室正与生物科技、量子计算、气候 建模等领域的先驱者共同孵化"不可能的任务”一例如用 生成式AI设计下一世代芯片,或是在虚拟宇宙中预演超
导材料的合成路径。 我深知,资本市场总渴望简单的叙事,但真正的技术 革命从来拒绝被标签化。当同行聚焦于如何用AI优化芯 片设计时,我们已在探索如何让AI成为芯片的“共生大
脑“-Blackwell架构中新增的自主学习单元,将使每块 GPU在运行中持续进化其计算策略。这如同教会鹰隼在
飞行中重塑羽翼,而非仅仅为它打造更精致的巢穴。 诸位同仁,请将今日的波动视为一份礼物:它让我们再次 审视自己的初心。办公桌上那个1999年的初代GPU工 程样片,至今仍在提醒我们一所有颠覆性技术,在诞生 之初都像一把未开刃的剑。它的价值不在于被多少人握
在手中,而在于持剑者是否有勇气劈开未知的迷雾。 未来十八个月,你们将见证英伟达历史上最密集的创新 发布。从能效比突破物理极限的量子混合计算方案,到 重新定义人机交互的神经接口原型,这些技术或许不会 立刻体现在股价曲线上,但它们将悄然重塑人类文明的
基石。 最后,请允许我引用一位工程师在DGX-1研发日志上的
留言:“我们不是在制造芯片,而是在铸造时间的钥匙。” DeepSeek或其他挑战者的出现,不过是证明了这把钥 匙正在打开更多人的想象力囚笼。而我们要做的,是确 保每个仰望星空的人,都能在英伟达的算力星河中找到属于自己的坐标。
山高路远,与君共赴。
黄仁勋
英伟达创始人兼CEO
啰里八嗦,不着边际
是从政治牛角尖里钻不出来的那些。
据说架构师以上职位的都明白是怎么回事,老川的科技顾问团也给了老川建议和评估。
一个中国人是条龙。但是合作精神非常成问题。特别是90后的独生子女一代。特别是江浙一带的。灰灭一个成绩出奇的快。我希望我的观察是错的。