对Deepseek从赞叹到压制,硅谷为何一周内大变脸?

今日头条
Toutiao
最新回复:2025年2月1日 9点40分 PT
  返回列表
78740 阅读
22 评论
极客公园

仅仅在登顶中国和美区苹果应用商店 24 小时后,国外科技巨头和监管层,对于 DeepSeek 的态度就发生了逆转。短短两天内,这家全球瞩目的中国 AI 新秀正面临着来自硅谷和华盛顿前所未有的压力。

1 月 28 日,Sam Altman 刚发文称 DeepSeek 的 R1 模型「令人印象深刻」,美国总统称 DeepSeek 是「很积极的技术成果」——而在第二天,OpenAI 突然改变立场,对媒体指控 DeepSeekSeek 未经许可「蒸馏」了其专有技术。

美国多位官员也发声支持这一指控,包括特朗普的人工智能顾问大卫·萨克斯(David Sacks)、特朗普提名的美国商务部长霍华德·卢特尼克 (Howard Lutnick)——「DeepSeek 利用『窃取』的美国技术和先进半导体,用极低成本创建了强大的人工智能模型。」Lutnick 当日表示。

特朗普的人工智能顾问大卫·萨克斯(David Sacks)指控 DeepSeek | 图片来源:X

而白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)则声称,美国官员正在评估 DeepSeek 对美国国家安全的影响。几周前,美国商务部工业和安全局(BIS)刚将智谱增列至出口管制实体清单(Entity List),智谱成为 AI「六小龙」中第一家被列入实体清单的大模型公司。

这一切源自 1 月 20 日 DeepSeek 发布的 R1 推理模型——它在多个逻辑任务(包括数学和编程)上的表现与 OpenAI-o1 旗鼓相当(并且远超 ChatGPT 各版本),而其运行成本仅为 OpenAI 费用的约 2%。这极大冲击了国外科技巨头的价值,微软、英伟达、甲骨文和谷歌母公司 Alphabet 等人工智能相关科技股暴跌,市值总计蒸发近 1 万亿美元。美国监管层对 DeepSeek 的态度也随之转向。

在 OpenAI 发出指控的第二天,另一家美国科技巨头 Anthropic 则直接建议阻止 DeekSeek 等中国公司的创新。1 月 30 日,Anthropic CEO Dario Amodei 发文呼吁美国政府加强对中国的芯片管制,以确保 AGI 只发生在美国。

这同样引起了政府的回应。同日,外媒援引消息人士的话称,美国正在考虑对售华芯片实施额外限制的可能性,其中包括 Dario 建议限制的芯片 H20。

两天之内,美国科技巨头及监管层对 DeepSeek 的态度由溢美转向压制,反映了其对自身「科技霸权」动摇的深层忧虑。随着 DeepSeek 等中国科技公司日益立于潮头,大洋彼岸的技术封锁也从算力、扩展到了模型等更广泛领域。目前的事件或许只是一个开端。

或许,历史将证明封闭和封锁并非维持优势的有效手段,甚至反而可能催生出如 DeepSeek 的巨大创新。开放与合作才代表未来。

而在这个未来到来之前,以 DeepSeek 为代表的中国科技公司,或许需要找到长期的应对之策。

「蒸馏」不等于「窃取」

此次 DeepSeek 的大模型「蒸馏」争议,起源于 OpenAI 的最大投资方微软。

1 月 29 日,外媒报道,微软的安全研究人员发现,DeepSeek 相关人士可能使用 OpenAI 应用程序编程接口 (API),未经授权「窃取」了大量数据。微软已将这一活动通知了 OpenAI。

当日,OpenAI 向外媒透露,它发现了 DeepSeek 使用「蒸馏」技术相关的证据。所谓的「蒸馏」,指通过对更大、更强模型的学习,让小型模型能够在特定任务上以更低的成本取得类似效果。相当于「徒弟」学「师傅」。

针对这种指控,DeepSeek 并未做出回应。

谈到大模型的「蒸馏」,并不等于窃取,其实是行业的一种常见做法。无论是在中国还是美国,AI 实验室普遍会使用 OpenAI 等领先公司的输出数据进行训练。「这意味着它们(新模型)可以免费获得人类反馈优化的成果。我并不惊讶 DeepSeek 可能也在这样做。」加州大学伯克利分校人工智能博士生 Ritwik Gupta 表示。

大模型的「蒸馏」过程 | 图片来源:CSDN

Ritwik Gupta 认为,真正核心的问题在于,「当用户利用数据来创建自己的模型并用于自身目的时,就会存在争议。」

OpenAI 的服务条款规定,用户不能「利用输出内容开发与 OpenAI 竞争的模型」。

「与 OpenAI 竞争的模型」,这个定义有一定的解释空间。例如 DeepSeek-R1 是一个开源模型,面向公众开放,而非自己商用,不一定符合这个定义。

唯一可以确定的是,OpenAI 正在加速封锁自己的出口、甚至谨慎释放自己的技术实力。可以说,它更极致地执行「闭源」。OpenAI 在声明中称,中国公司和其他公司一直在试图「蒸馏」美国领先 AI 公司的模型,OpenAI 将采取一系列反制措施来保护知识产权,包括在发布模型时审慎决定纳入哪些前沿能力。

这不只是公司意志,更是国家意志。OpenAI 称未来与美国政府密切合作至关重要,「这样才能更好地保护最强大的模型,防止对手和竞争对手获取美国技术。」

1 月 28 日,谷歌前首席执行官兼董事长 Eric Schmidt 联合撰写了一篇文章,文章名为《中国的开源人工智能会终结美国在该领域的霸权吗》。Schmidt 表示,DeepSeek 崛起之后,目前全球 AI 领域的权力格局似乎正在围绕两个关键轴转移:一是中美之间的竞争,二是封闭与开源模式的较量。

闭源和开源的互补

这是一个颇具戏剧性的时刻:中国科技公司从过去全球开源的受益者,逐渐变成了开源的反哺者、甚至引领者——从巨头阿里巴巴、初创公司 Minimax、再到此次爆火的 DeepSeek 等,均通过开源向全球开发者免费开放 AI 模型、反哺全球科技生态。

而大多数美国主要科技公司(除了 Meta 之外),仍坚持闭源,并更严格地保密其技术方法。

海外网友甚至调侃 OpenAI 为「CloseAI」。

与此相对的是,DeepSeek 这样的科技公司,通过开源以及与 AMD、华为等厂商的紧密合作,成为了真正「Open」的 AI 公司。当全球无数开发者得以在本地设备上部署运行 R1 模型、并由此衍生出各种应用场景用法,DeepSeek 因此获得了全球开发者的支持、为现在的「爆红出圈」打下了基础。

这证明了开放,才是 AGI 时代最核心的竞争力之一。

即使 OpenAI 现在出来表示「DeepSeek 的研究成果我们更在之前也发现了」,但 DeepSeek 作为率先开源的厂商,仍然收获了全球各地用户与开发者最多的掌声:

将自己走过的路公布出来,让其他人可以少走弯路,快速收敛到最优路径上,开源的意义就在于此。

更重要的是,开源被证明拥有不输于闭源的价值。

此前,由美国构建的闭源模型(如 OpenAI 的 o3 和 Anthropic 的 Claude 3 Opus)一直被视为行业标杆。而开源模型(尤其是中国的开源模型)通常被认为落后几个月。然而,DeepSeek 的 R1 和多模态模型 Janus Pro 彻底彻底改变了这一认知。

当开源模型能在性能上追平闭源对手,这可能会颠覆整个人工智能行业的生态。其低成本优势必将吸引更多开发者,最终可能在这场技术角逐中获胜。

使用容器 App 等方式,已经可以实现完全在手机端侧运行 DeepSeek R1 模型 | 图片来源:X

海外社交媒体上频繁出现这样的「反思」:AGI 时代,依靠着开源与合作,中国同样有机会比美国更先到达 AI 领域的下一个节点。

Eric Schmidt 在文章中呼吁,美国已经拥有世界上最好的闭源模型,为了保持竞争力,还必须支持一个充满活力的开源生态系统的发展。「开源和闭源竞争很可能会找到一种自然的平衡,为不同用户带来一系列不同的产品和价格点。」他说。

OpenAI(以及一众 AI 大厂)和 Deepseek(以及期待更多 AI 新锐)的理想状态,更应该是一幅太极图:闭源对开源、充裕对短缺、外扩对内修、大力对灵巧……看似相克,实则相生。

只有两者互补、而非对立,才有利于人类通向 AGI 之路。因为后者会带来对抗,而前者则能形成合力。

开放,才是未来

在对 DeepSeek 的赞誉之后,大洋彼岸的科技巨头与政府迅速转变态度,核心是在政策层面加速「封锁」。

1 月 29 日,在 DeepSeek「蒸馏」指控之后,白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)表示,美国官员正在评估 DeepSeek 对美国国家安全的影响。

30 日,Anthropic 的 CEO Dario Amodei 直接发文呼吁美国政府加强对中国的芯片管制。他认为 DeepSeek 的成功并未降低美国芯片算力的价值,相反在通往 AGI 的道路上,未来仍需要数百万块芯片、数百亿美元(至少)。只有继续加剧出口管制,才能保证美国的技术单极「霸权」。

同日,外媒援引消息人士的话称,美国正在考虑对售华芯片实施额外限制的可能性。报道指出,限制措施将涉及英伟达公司的 H20 芯片——这正是 Dario 在文章中建议要限制的芯片,过去由于其训练效率较低,它被允许出口。据消息人士透露,关于限制措施的决定很可能不会很快做出。

DeepSeek 还面临着来自现实物理层面的挑战。据网络安全公司奇安信的专家证实,自 1 月 28 日起,该公司遭遇了来自美国 IP 地址的持续网络攻击,包括 DDoS 攻击和密码破解等多种形式。两天后,攻击暴增百倍。

1 月 28 日,深度求索(DeepSeek)官网显示,其线上服务受到大规模恶意攻击 | 来源 DeepSeek

这些事件背后折射出的深层事实是:随着 DeepSeek 等中国科技公司的崛起,其极大地冲击了国外科技巨头,并动摇了美国长期以来的「科技霸权」。后者似乎想沿用过去的技术限制和封锁手段,维持其主导地位、阻止这一进程。

如果说过去主要封锁的是算力,现在则是同时封锁算力和模型。

但历史可能会证明,试图通过技术封锁来维持优势的做法终将失效。就像过去对算力的限制一样,这种封锁不仅无法阻挡创新,反而催生出了 DeepSeek 这样的巨大创新。

或许在迈向 AGI 的征程中,开放,才是真正的核心竞争力。

更何况,开源模型不是 TikTok 那样依赖互联网的在线服务,它自带「跨越封锁」的属性:如今不仅是高性能主机的用户可以在端侧运行 DeepSeek R1,有开发者甚至研究出了使用本地 App,让蒸馏后 1.5B 大小的 DeepSeek R1 能够完全离线端侧运行在 iPhone 上。这意味着它很难被真正封锁。

「美国的竞争优势长期以来依赖于开放科学、以及产业、学术界和政府的协同合作。我们应该重新拥抱开放科学的可能性,让其再次成为推动美国 AI 发展的动力。」Eric Schmidt 称。

科技从业者的普遍观点是,硅谷科技公司应该追求科技「领导力」而非「霸权」。因为后者必然引发抵抗,产生离心力,难以长期维持。而前者能促进合作,凝聚向心力,推动人类科技进步。硅谷当前确实拥有科技「领导力」,但若一味追求「霸权」地位,反而可能失去这一核心优势,最终作茧自缚被更多具有创新思想的创业者反超。

开放,才是真正的未来,DeepSeek 就是最好的代表。

龙起卷
1 楼
意识到科技霸权结束了,揭开只能美国玩高端AI的谎言
樱桃儿熟了
2 楼
呜呼,几十年的硅谷神话破灭了。 因为,硅谷叫疼了,众人走近一看,发现硅谷这个神真的流血了🩸 什么?!神还会流血?! 于是乎,神话破灭了。
一婊淫才
3 楼
因为发现了里面其实是一包糠,又是“弯道超车”的玩意儿😏 [1评]
小日子坏的很
4 楼
openai有一个办法不被提炼,就是闭源,不对外使用,可以先吧名字改一下,closeai。
灯塔路
5 楼
修昔底德综合症
蛤蟆长者
6 楼
劣等殖畜除了反华啥也不懂。 你比华尔街 硅谷更懂哈哈哈哈 知道开源啥意思吗
g
googlebot
7 楼
美国要输了,
s
snake1101
8 楼
y
yuanfangzhi
9 楼
对Deepseek从赞叹到压制,硅谷为何一周内大变脸? ---------------------------------- 面对竞争对手,不去想着如何提高自己的竞争力?反而通过抹黑妖魔化对手希望借助政府的“国家之力”替自己除掉竞争对手,这和黑帮有什么区别? 典型的输不起!
y
yuanfangzhi
10 楼
[8楼]评论人:snake1101 早就说了,美国这16亿《反华宣传》的经费没白花,这些《反华文案》一部接着一部,试想一下普通人谁这么闲整天做这个? 而且最可恨的是制造这些反华文案的背后是一个个长着中国面孔,说着中国话,吃着中国饭长大的狗粮!你就说狗粮是个什么东西?
榴莲车
11 楼
打不过了,就禁止。强买强卖!
关注者
12 楼
和小米抄出了保时捷没什么区别 [1评]
a
ares333
13 楼
Openai说deepseek是小偷,又不敢提供证据,就凭张嘴胡说八道,别忘了OpenAi现在还有6状官司没打完,被人告它偷窃知识产权🤣🤣 [1评]
G
Griller
14 楼
洼地文化不意外的。
金山浪人
15 楼
真正的AI专家都心知肚明所谓的“蒸馏”只是在业界常用的“雕虫小技”,真正的AI专家都不屑拿出来谈论。以前AI大模型公司需要购买海量人工标注好的数据来训练,例如用1万张人工标注为狗的图片来训练大模型,然后用另外2千张标注为狗的图片来验证训练过的大模型来算准确率。所谓的“蒸馏”的方法是依靠已经训练好的AI大模型代替人工来“标注”图片用于训练、验证新的大模型,其好处是购买API的费用要远低于购买人工标注的数据,如果是自己的大模型就相当于免费。但是如果原始大模型有误判,那么新的大模型就会在错误的道路上一路狂奔得不偿失。所以一般业内一般会用“蒸馏”出来的数据做为验证之用,可以节省部分成本而已。哪怕DeepSeek“蒸馏”了CloseAI也是付了钱了,可以帮助CloseAI摊平购买原始数据的成本。其实CloseAI自己才是真正的恶劣,有内部“吹哨者”因为揭露CloseAI疯狂“白嫖”(蒸溜)出版社、网络作者的知识产权而“被消失”。
榴莲车
16 楼
压制?怎么压制?凭你美国一己之力?乌合之众?美国第一让你成为孤家寡人了。
榴莲车
17 楼
研究懂了再发言吧。
j
jasonc7891
18 楼
从不自信到恐惧。哈哈
j
jman
19 楼
如果美国坚持闭源,5年内它一定会破产!!!
史前巨混
20 楼
这多简单,不自信了吧。自信满满大力飞砖的美帝才是大家熟悉的
南方兔儿爷
21 楼
不过是想技术垄断赚钱罢了,却没想到AI这东西就是个学习的过程而不是终极的天花板,人学会了生火,那就有成千上万的可能。
h
hotcpu
22 楼
蒸馏本身没问题。 你拿蒸馏结果商用就是偷。 手脚灵活是门技术, 你拿去偷钱包那就是贼了。 deepseek 自己都说自己是做framework 的而不是大模型公司, 楞把他往大模型上抬就是害他。 你说自己训练, 你买过哪些数据做训练了? 拿出来看看, 预训练数据集是啥?