NPR电台里OpenAI的官员谈DeepSeek - 2025年1月31日北美华人网存档

7 个月

楼主 (北美华人网)

刚刚回家的路上听了一耳朵，挺有意思的。
--------------------
主持人Kelly问OpenAI的官员：你的公司说正在调查DeepSeek是否不正确的使用了OpenAI data？
OpenAI官员：我们正在评估what may or may not have occurred. 然后提到了distillation这个事物，说这个事物很复杂。他们要调查是否DS sent了大量的东西到ChatGPT，得到ChatGPT的回应后，带着information离开，然后用这些information去制作了DS自家的产品。
主持人这时候提了一个很有见解的问题：DS possibly access your data这件事，跟你们公司自己train ChatGPT on other people's work without their permission，两者的差别在哪？
OpenAI官员打了一个比方来回答：如果我去图书馆借了一本书，看完之后还了书，但我获得了信息留在我的脑子里。而另外一种情形是，我去图书馆借了一本书，借了书不还，然后把这本书的作者改成我自己。这两者显然不同。
话到此，官员话锋一转说：但是，更重要的是中国美国之间现在显然是有一场激烈的AI 竞争（But I think the big point is there is a real competition between US and China）。
----------------------------
我的理解是，官员在抱怨说我们OpenAI用了纽约时报、百科全书或者其它大模型来训练ChatGPT，我们没有说这是我们自己的东西（当然死掉的吹哨人有不同看法）；DS如果用了我们的ChatGPT来获取了资料并训练了DS，就等于借书不还、还把书的作者改了。

helloterran4

7 个月

mtwash 发表于 2025-01-30 20:11
刚刚回家的路上听了一耳朵，挺有意思的。
--------------------
主持人Kelly问OpenAI的官员：你的公司说正在调查DeepSeek是否不正确的使用了OpenAI data？
OpenAI官员：我们正在评估what may or may not have occurred. 然后提到了distillation这个事物，说这个事物很复杂。他们要调查是否DS sent了大量的东西到ChatGPT，得到ChatGPT的回应后，带着information离开，然后用这些information去制作了DS自家的产品。
主持人这时候提了一个很有见解的问题：DS possibly access your data这件事，跟你们公司自己train ChatGPT on other people's work without their permission，两者的差别在哪？
OpenAI官员打了一个比方来回答：如果我去图书馆借了一本书，看完之后还了书，但我获得了信息留在我的脑子里。而另外一种情形是，我去图书馆借了一本书，借了书不还，然后把这本书的作者改成我自己。这两者显然不同。
话到此，官员话锋一转说：但是，更重要的是中国美国之间现在显然是有一场激烈的AI 竞争（But I think the big point is there is a real competition between US and China）。
----------------------------
我的理解是，官员在抱怨说我们OpenAI用了纽约时报、百科全书或者其它大模型来训练ChatGPT，我们没有说这是我们自己的东西（当然死掉的吹哨人有不同看法）；DS如果用了我们的ChatGPT来获取了资料并训练了DS，就等于借书不还、还把书的作者改了。

所以OpenAI剽窃Github代码的案子，吹哨人怎么死的？
剽窃了全互联网，现在摇身一变成了“自己的作品”，OpenAI这些烂人的格局就决定了它们没有前途
DS根本没想跟美国人竞争。是美国人自己知道自己全身都烂光了，指着SpaceX和ChatGPT两个玩意儿当精神支柱。
中国AI不领先，中国还是中国
美国AI不领先了，美国就崩盘了。基于“赢”的凝聚力彻底消失。

HalloweenKanga

7 个月

没有看懂这位官员的逻辑，这么差的sour loser心态，以后还能竞争赢吗？
Altman把自己的AI首席科学家挤走，卸磨杀驴，输了活该！

catgoose

7 个月

回复 2楼 helloterran4 的帖子
OpenAi所有者是微软，Gibhub所有者也是微软。

一

一尼逆

7 个月

https://mp.weixin.qq.com/s/wnM-40BrRNmidi7mvRw_GQ
华盛顿的组合拳打不垮DeepSeek，因为我们的生存策略写在每一行抗量子加密代码里，刻在每块定制化AI加速芯片上。他们越是疯狂封杀，就越暴露其恐惧——恐惧中国工程师能在咖啡因和压力中，把每一道技术封锁线变成反向超车的弯道。这场风暴终将过去，而风暴眼里的DeepSeek，正在改写游戏规则。

minqidev

7 个月

数据就是百科全书，和图书馆的各种书籍。 OpenAI，那了个本子，记下所有书的名字和摘要，并写下自己的感想。你只有去图书馆的前台索要才能看到。
然后，Deepseek去图书馆，购买力openAI的检索服务，能够更快的找到书，带了个本子做了笔记，照着样子也做了一个检索，还特别喜欢数学书籍，还专门借了然后写下感想，然后也发布到了网上。

hijklmn

7 个月

那借了书把书留在脑子里，脑子里的东西能跟别人share吗？
好吧，就算脑子里的东西可以share，那用这种方法来比喻，OpenAI就是借了书，复印了，然后换个包装还把署名改成自己的。。。

minqidev

7 个月

回复 7楼 hijklmn 的帖子
😄，他其实偷了别人的知识，不但不跟人分享，也不准别人去看书记下来，因为他怀疑别人用了他服务然后把书的知识都拷贝下来。
只要看一看数据用了多少不就知道是不是吗？OpenAI又不能无线下载数据

znmyhj

7 个月

OpenAI这个人的比喻根本不对，既然OpenAI也是从图书馆借的书上记下来的信息，那又有什么资格声称自己是信息拥有者？

渔

渔非凡

7 个月

这个采访今天我也听了，他一直侃侃而谈deepseek真的有造成威胁，哪怕偷了database，最后主持人问他有没有用deepseek，他说没有，没有用过你说个der

xpinger2017

7 个月

回复 7楼 hijklmn 的帖子
不能说是复印，OpenAI自己的心得，人家是看不到的，就相当于一个老中医行医，他的经验是总结很多原住民的土方得到的，并没有人家的授权。后来他带了个学生 Deepseek ，但是也藏私，并不教心得，只让学生看他收病人，给处方。 Deepseek 看多了，自己有了心得，总结出来，公开了让大家看。

Harenough

7 个月

回复 2楼 helloterran4 的帖子
OpenAi所有者是微软，Gibhub所有者也是微软。
catgoose 发表于 2025-01-30 20:30

你太搞笑了
微软只有一部分股权，其他股东的利益呢？

Dingmoren2

7 个月

OpenAI 借了书，总结归纳拿来卖钱。deep seek借了书，也看了OpenAI 的总结归纳，自己进一步提炼，免费提供给全网。

Emilyll

7 个月

油管上某个评论挺能解释他们的行为：“I just felt a sharp pain in my income" destroyed me.

mtwash

7 个月

Dingmoren2 发表于 2025-01-30 22:13
OpenAI 借了书，总结归纳拿来卖钱。deep seek借了书，也看了OpenAI 的总结归纳，自己进一步提炼，免费提供给全网。

所以主持人那个问题真的有点犀利，一下让OpenAI的那位官员准备的答案不是很合适用上，硬套上去，但逻辑是不太通顺的。
我在想的是，这种带有公关性质的采访，OpenAI难道没跟主持人套招套好问什么问题吗？我知道美国的采访，也是可以提前套好问题，或者给大纲什么的。即便官员的立场不变，针对这个问题也可以有更好的回答，那个图书馆借书的比喻其实有点挫。

minqidev

7 个月

回复 15楼 mtwash 的帖子
对于记者来说，完成任务只能给你工资；但是在历史转折点，引起争议，能被记住一辈子，也可以改变人生。
比如，文在寅当总统前，最高光的时候，是帮五个中国渔民辩护，这五个渔民是杀人犯，杀了韩国籍船长。按道理应付就行了，但是他没应付，挖出来了船长虐待船员的历史，帮这五个人避免了无期徒刑。从此也走向了人生高峰

frank_rainbow

7 个月

回复 4楼 catgoose 的帖子
GitHub是微软的，所以GitHub上的代码仓库的知识产权都归微软了？所以微软就可以替用户决定代码可以被CloseAI随便用？你替微软定的这规矩？

neolith2000

7 个月

回复 4楼 catgoose 的帖子
微软拥有github 不拥有GitHub用户的代码

wa8445

7 个月

mtwash 发表于 2025-01-30 20:11
刚刚回家的路上听了一耳朵，挺有意思的。
--------------------
主持人Kelly问OpenAI的官员：你的公司说正在调查DeepSeek是否不正确的使用了OpenAI data？
OpenAI官员：我们正在评估what may or may not have occurred. 然后提到了distillation这个事物，说这个事物很复杂。他们要调查是否DS sent了大量的东西到ChatGPT，得到ChatGPT的回应后，带着information离开，然后用这些information去制作了DS自家的产品。
主持人这时候提了一个很有见解的问题：DS possibly access your data这件事，跟你们公司自己train ChatGPT on other people's work without their permission，两者的差别在哪？
OpenAI官员打了一个比方来回答：如果我去图书馆借了一本书，看完之后还了书，但我获得了信息留在我的脑子里。而另外一种情形是，我去图书馆借了一本书，借了书不还，然后把这本书的作者改成我自己。这两者显然不同。
话到此，官员话锋一转说：但是，更重要的是中国美国之间现在显然是有一场激烈的AI 竞争（But I think the big point is there is a real competition between US and China）。
----------------------------
我的理解是，官员在抱怨说我们OpenAI用了纽约时报、百科全书或者其它大模型来训练ChatGPT，我们没有说这是我们自己的东西（当然死掉的吹哨人有不同看法）；DS如果用了我们的ChatGPT来获取了资料并训练了DS，就等于借书不还、还把书的作者改了。

这个比喻不对吧，closeai回答问题时也没说，它的知识是从那个网站上拔下来的。

一

一尼逆

7 个月

1. 芯片断供？早就不是A100的单选题了 当华盛顿把英伟达特供芯片的漏洞堵死时，他们可能没注意到长三角的半导体实验室里发生了什么。我们训练集群现在跑着三套并行的硬件方案：华为昇腾的异构计算卡处理基础层，寒武纪的思元芯片跑强化学习模块，连壁仞科技的BR100都在某些场景下达到了替代效果。最狠的是自研的分布式框架——能把一个千亿参数模型拆解成乐高积木，用30%的国产算力冗余换来了85%的整体效率。上周刚在国产集群上跑通了多模态预训练，这意味着什么？断供清单追不上技术迭代的速度了。 2. 数据战背后的阳谋 说我们"抄袭开源代码"的指控特别有意思——OpenAI当初用GitHub海量代码训练模型时怎么没人跳脚？现在我们把1.2亿token的清洗后的高质量数据开源，相当于把AI训练的"食材市场"直接掀了桌子。德国马普所的研究员连夜发推："这些标注数据里居然有完整的中华古籍token化方案，这是西方数据库从未覆盖的维度。" 数据主权战争的胜负手，从来不在法庭而在实验室。 3. 国际市场正在发生诡异分流 苹果商店下架确实痛，但你可能不知道中东王室基金的技术顾问们正在批量采购我们的企业API——他们受够了被硅谷模型塞进"中东=恐怖主义"的语义框架。更魔幻的是东南亚，当地开发者用我们的开源工具训练出了能理解20种土著方言的医疗大模型，而GPT-4在这里的误诊率高得吓人。当"去中心化AI"成为全球草根开发者的刚需时，华盛顿的禁令反而成了我们的活广告。 4. 网络攻击揭开的是另一场战争 那些持续27天、峰值达到680Gbps的DDoS攻击，表面看是黑客行为，但流量溯源显示攻击节点集中在某国军方承包商IP段。我们的应对策略？直接把流量引到苏州阳澄湖底的"深湖数据中心"——那座建在水下30米、通过液冷散热节约40%能耗的堡垒，扛住了最猛烈的第一波冲击。现在每天自动生成的攻击指纹图谱，反而成了训练AI安全系统的养料。 5. 生态链的"非对称反击 最让对手睡不着觉的可能是这个：我们在合肥建了个"反脆弱孵化器"，把被制裁的国产GPU厂商、被迫转型的自动驾驶公司、甚至被踢出SWIFT系统的能源企业拉到一个池子里。结果呢？某家做车用雷达的突然发现，他们的信号处理算法能优化模型并行训练；搞光伏逆变器的企业贡献了新的电力调度方案，把训练集群的PUE值压到了1.08。这种野路子的创新生态，才是美式制裁逻辑无法拆解的存在。 说到底，这场较量早就不是"一个中国公司VS美国"的简单剧本。当柏林医院的AI诊断系统用着我们的底层技术，当沙特阿美的油井预测模型跑在我们的框架上，当阿根廷农民用本地化部署的农业大模型对抗气候灾害时——所谓"制裁"正在催生出一个华盛顿完全无法理解的科技新大陆。 至于能不能活？看看深圳湾凌晨三点的码头吧，那些装着国产AI芯片的集装箱正和跨境电商货柜一起出海，这画面比任何宣言都真实。

minqidev

7 个月

这个比喻不对吧，closeai回答问题时也没说，它的知识是从那个网站上拔下来的。
wa8445 发表于 2025-01-30 23:17

难道不是从网上拔下来的？有谁给他许可了？中文的网站给他许可了？
刚刚看到一条消息，美国在考虑，STEM里面，可能放松AI专业签证给中国留学生。也就是说，你要比他牛，才不制裁你。

fantancyseeker

7 个月

mtwash 发表于 2025-01-30 20:11
刚刚回家的路上听了一耳朵，挺有意思的。
--------------------
主持人Kelly问OpenAI的官员：你的公司说正在调查DeepSeek是否不正确的使用了OpenAI data？
OpenAI官员：我们正在评估what may or may not have occurred. 然后提到了distillation这个事物，说这个事物很复杂。他们要调查是否DS sent了大量的东西到ChatGPT，得到ChatGPT的回应后，带着information离开，然后用这些information去制作了DS自家的产品。
主持人这时候提了一个很有见解的问题：DS possibly access your data这件事，跟你们公司自己train ChatGPT on other people's work without their permission，两者的差别在哪？
OpenAI官员打了一个比方来回答：如果我去图书馆借了一本书，看完之后还了书，但我获得了信息留在我的脑子里。而另外一种情形是，我去图书馆借了一本书，借了书不还，然后把这本书的作者改成我自己。这两者显然不同。
话到此，官员话锋一转说：但是，更重要的是中国美国之间现在显然是有一场激烈的AI 竞争（But I think the big point is there is a real competition between US and China）。
----------------------------
我的理解是，官员在抱怨说我们OpenAI用了纽约时报、百科全书或者其它大模型来训练ChatGPT，我们没有说这是我们自己的东西（当然死掉的吹哨人有不同看法）；DS如果用了我们的ChatGPT来获取了资料并训练了DS，就等于借书不还、还把书的作者改了。

纯属狡辩，骗不懂AI到底是怎么回事的人。GPT和DS又不是数据库，还看书然后记下来，可笑。NN训练最后是存结构和参数，以为是死记硬背哪。

MandyF

7 个月

其他不知道，看出了ds真的对他们造成了很大的威胁

manyworlds

7 个月

看来是把Open AI的人震傻了，什么图书馆借书的比喻完全是瞎扯淡

minqidev

7 个月

纯属狡辩，骗不懂AI到底是怎么回事的人。GPT和DS又不是数据库，还看书然后记下来，可笑。NN训练最后是存结构和参数，以为是死记硬背哪。
fantancyseeker 发表于 2025-01-31 00:45

其实都是打标签，就是利用程序和人工的手段，给现有的信息做标记，然后让AI能够识别和学习。
至于，想象的输入一个东西，然后保存chat gpt的结果，这个基本不可能。大面积的套结果，chat gpt可以很容易的发现，并且断开IP.
所以，像这种提高几十倍效率的，必然要自己编写一种跨时代的打标签工具。说白了，光这个他们自己使用的打标签工具发布的话，就足够让scale AI，一文不值。不过也许就是deepseek更大的长处，他们搜集和标记信息的能力更强。

paustin

7 个月

catgoose 发表于 2025-01-30 20:30
回复 2楼 helloterran4 的帖子
OpenAi所有者是微软，Gibhub所有者也是微软。

windows的所有者也是微软，那么问题来了，你用windows的电脑上的所有东西都是微软的吗

lnghng

7 个月

Openai 不是到图书馆里借，而是未经允许跑到人家私人图书馆里去偷偷抄，然后总结一下拿来卖钱

elevenoclock

7 个月

Open AI 想说自己是黄蓉的娘，九阴真经是我看了以后默写的，deepseek是梅超风

花

花花猪

7 个月

大家开车的时候一般用什么听新闻？

xpinger2017

7 个月

minqidev 发表于 2025-01-30 23:22
难道不是从网上拔下来的？有谁给他许可了？中文的网站给他许可了？
刚刚看到一条消息，美国在考虑，STEM里面，可能放松AI专业签证给中国留学生。也就是说，你要比他牛，才不制裁你。

这个问题，ｏｐｅｎＡＩ　正官司缠身呢，怎么可能有许可，问这个问题都是外行不知道所有的　大模型训练的海量数据都是互联网上爬下来的，用来训练都是没有经过许可的但这种用法是不是违法，因为没有先例，所以还在打官司ＯＰｅｎＡＩ用图书馆的例子是有原因的，大众都没有图书的版权，但是可以去图书馆借书，这个不是违反版权，是 fair　use,　所以　ｏｐｅｎＡＩ也认为自己即使没有授权使用，也是　ｆａｉｒ　ｕｓｅ，不侵权

nomorewaiting

7 个月

minqidev 发表于 2025-01-30 23:22
难道不是从网上拔下来的？有谁给他许可了？中文的网站给他许可了？
刚刚看到一条消息，美国在考虑，STEM里面，可能放松AI专业签证给中国留学生。也就是说，你要比他牛，才不制裁你。

从懂王第一任期开始对中国留学生特别是stem专业的visa诸多刁难和阻挠，导致很多原本计划赴美的中国理工科毕业生留在了中国，然后八年来中国科技企业爆发式增长和发展有目共睹。这些毕业生赴美后大概也就在大厂找个坑熬身份结婚买房养娃了。

nakamoto

7 个月

这个问题，ｏｐｅｎＡＩ　正官司缠身呢，怎么可能有许可，问这个问题都是外行不知道所有的　大模型训练的海量数据都是互联网上爬下来的，用来训练都是没有经过许可的但这种用法是不是违法，因为没有先例，所以还在打官司ＯＰｅｎＡＩ用图书馆的例子是有原因的，大众都没有图书的版权，但是可以去图书馆借书，这个不是违反版权，是 fair　use,　所以　ｏｐｅｎＡＩ也认为自己即使没有授权使用，也是　ｆａｉｒ　ｕｓｅ，不侵权
xpinger2017 发表于 2025-01-31 13:18

OpenAI 绝对不是Fair Use。任何Fair Use 必须满足一个或多个以下条件
1 - 非商用，就是不能以此赚钱牟利。OpenAI 用了别人的东西为自己贪婪牟利，每个股东雇员都赚得盆满钵满 2 - 用的很少，少量的quotation 是 Fair Use，OpenAI 是把别人的成果全部吃掉了 3 - 不对原作者造成负面的经济影响，OpenAI 的产品显然对原作者的经济打击很大
图书馆和Deepseek 至少是满足了 1，自己不赚钱
把别人的东西不付钱就拿来，为自己赚钱也叫Fair Use？那是强盗逻辑

ganymede

7 个月

AI content and any works created solely by AI cannot be copyrighted in the United States.
这个官员的采访我也听了，他其实根本没有站得住脚的依据来指责deepseek抄袭，也说了这个distillation是行业里的一个普遍做法，最终把谈话拉回中美AI竞争，我们要更多的钱，stargate非常好。

helloterran4

7 个月

AI content and any works created solely by AI cannot be copyrighted in the United States.
这个官员的采访我也听了，他其实根本没有站得住脚的依据来指责deepseek抄袭，也说了这个distillation是行业里的一个普遍做法，最终把谈话拉回中美AI竞争，我们要更多的钱，stargate非常好。
ganymede 发表于 2025-01-31 13:33

Deepseek刚创作的金句：
美国国家安全和萝莉岛有什么联系？
US national security is like those bitches on Orgy Island—any American politician can use it at will, as long as their corporate conglomerate keep pushing them.

fantancyseeker

7 个月

minqidev 发表于 2025-01-31 01:56
其实都是打标签，就是利用程序和人工的手段，给现有的信息做标记，然后让AI能够识别和学习。
至于，想象的输入一个东西，然后保存chat gpt的结果，这个基本不可能。大面积的套结果，chat gpt可以很容易的发现，并且断开IP.
所以，像这种提高几十倍效率的，必然要自己编写一种跨时代的打标签工具。说白了，光这个他们自己使用的打标签工具发布的话，就足够让scale AI，一文不值。不过也许就是deepseek更大的长处，他们搜集和标记信息的能力更强。

所以Alex Wang在CNBC大放厥词，瞎编什么DS用了5万H100云云，就是因为动了他的蛋糕。

chairsky

7 个月

都中了这比喻的圈套，openai一开始就是偷书，哪里是借书

LamourEstIci

7 个月

helloterran4 发表于 2025-01-30 20:23
所以OpenAI剽窃Github代码的案子，吹哨人怎么死的？
剽窃了全互联网，现在摇身一变成了“自己的作品”，OpenAI这些烂人的格局就决定了它们没有前途
DS根本没想跟美国人竞争。是美国人自己知道自己全身都烂光了，指着SpaceX和ChatGPT两个玩意儿当精神支柱。
中国AI不领先，中国还是中国
美国AI不领先了，美国就崩盘了。基于“赢”的凝聚力彻底消失。

你说不是一回事：
吹哨人：前 OpenAI 研究员印度裔美国人 Suchir Balaji 于 2024年11 月 26 日在旧金山的公寓中被自杀，未发现外部侵害迹象。Suchir Balaji加州大学伯克利2021年毕业，曾对使用受版权保护的材料来训练 AI 模型（如 ChatGPT ）的行为提出了伦理方面的担忧。作为一名知名的伦理批评者，他公开质疑了使用版权材料训练生成式 AI 模型（如 ChatGPT）的做法。在接受《纽约时报》采访时，Balaji 指责 OpenAI 的数据收集做法存在危害。他表示：“如果你认同我的观点，那你必须离开公司。”他对 GPT-4 如何利用大量互联网数据进行训练的行为尤其担心。 Balaji 主要关注的是生成式 AI 可能会输出与原始版权作品相竞争的内容。在一篇博文中，他指出，“没有证据表明 ChatGPT 使用的训练数据可以视作合理使用。”他还强调，这不仅仅是 OpenAI 的问题，而是一个涉及整个行业的大问题：“合理使用与生成式 AI 之间的争议，远远超出了任何单一公司或产品。” 近年来针对 OpenAI 的诉讼案件不断，包括《纽约时报》在内的主要媒体指控该公司侵犯了版权。巴拉吉在相关法院文件中被提及 —— 拥有“独特且相关的文件”以支持这些诉讼的人。

LamourEstIci

7 个月

helloterran4 发表于 2025-01-30 20:23
所以OpenAI剽窃Github代码的案子，吹哨人怎么死的？
剽窃了全互联网，现在摇身一变成了“自己的作品”，OpenAI这些烂人的格局就决定了它们没有前途
DS根本没想跟美国人竞争。是美国人自己知道自己全身都烂光了，指着SpaceX和ChatGPT两个玩意儿当精神支柱。
中国AI不领先，中国还是中国
美国AI不领先了，美国就崩盘了。基于“赢”的凝聚力彻底消失。

剽窃是openAI另一个一项目【OpenAI应用AI研究员Shyamal Anadkat ，放出了全新多智能体框架——Swarm】
年仅20岁的Swarms Corporation创始人Kye Gomez自曝，「OpenAI侵犯了团队的知识产权」。 Gomez创立的公司Swarms Corporation，专注于开创多智能体革命。OpenAI不仅窃取了名字、代码和方法。而且，从智能体结构的语法，到群体类对象，一切都是从如下代码库中窃取的。https://github.com/kyegomez/swarms

badgerbadger

7 个月

elevenoclock 发表于 2025-01-31 11:47
Open AI 想说自己是黄蓉的娘，九阴真经是我看了以后默写的，deepseek是梅超风

是这个意思😂

cathynd

7 个月

回复 28楼 elevenoclock 的帖子
笑死了，这比喻很妙

月

月亮的雨

7 个月

一尼逆发表于 2025-01-30 23:18
1. 芯片断供？早就不是A100的单选题了 当华盛顿把英伟达特供芯片的漏洞堵死时，他们可能没注意到长三角的半导体实验室里发生了什么。我们训练集群现在跑着三套并行的硬件方案：华为昇腾的异构计算卡处理基础层，寒武纪的思元芯片跑强化学习模块，连壁仞科技的BR100都在某些场景下达到了替代效果。最狠的是自研的分布式框架——能把一个千亿参数模型拆解成乐高积木，用30%的国产算力冗余换来了85%的整体效率。上周刚在国产集群上跑通了多模态预训练，这意味着什么？断供清单追不上技术迭代的速度了。 2. 数据战背后的阳谋 说我们"抄袭开源代码"的指控特别有意思——OpenAI当初用GitHub海量代码训练模型时怎么没人跳脚？现在我们把1.2亿token的清洗后的高质量数据开源，相当于把AI训练的"食材市场"直接掀了桌子。德国马普所的研究员连夜发推："这些标注数据里居然有完整的中华古籍token化方案，这是西方数据库从未覆盖的维度。" 数据主权战争的胜负手，从来不在法庭而在实验室。 3. 国际市场正在发生诡异分流 苹果商店下架确实痛，但你可能不知道中东王室基金的技术顾问们正在批量采购我们的企业API——他们受够了被硅谷模型塞进"中东=恐怖主义"的语义框架。更魔幻的是东南亚，当地开发者用我们的开源工具训练出了能理解20种土著方言的医疗大模型，而GPT-4在这里的误诊率高得吓人。当"去中心化AI"成为全球草根开发者的刚需时，华盛顿的禁令反而成了我们的活广告。 4. 网络攻击揭开的是另一场战争 那些持续27天、峰值达到680Gbps的DDoS攻击，表面看是黑客行为，但流量溯源显示攻击节点集中在某国军方承包商IP段。我们的应对策略？直接把流量引到苏州阳澄湖底的"深湖数据中心"——那座建在水下30米、通过液冷散热节约40%能耗的堡垒，扛住了最猛烈的第一波冲击。现在每天自动生成的攻击指纹图谱，反而成了训练AI安全系统的养料。 5. 生态链的"非对称反击 最让对手睡不着觉的可能是这个：我们在合肥建了个"反脆弱孵化器"，把被制裁的国产GPU厂商、被迫转型的自动驾驶公司、甚至被踢出SWIFT系统的能源企业拉到一个池子里。结果呢？某家做车用雷达的突然发现，他们的信号处理算法能优化模型并行训练；搞光伏逆变器的企业贡献了新的电力调度方案，把训练集群的PUE值压到了1.08。这种野路子的创新生态，才是美式制裁逻辑无法拆解的存在。 说到底，这场较量早就不是"一个中国公司VS美国"的简单剧本。当柏林医院的AI诊断系统用着我们的底层技术，当沙特阿美的油井预测模型跑在我们的框架上，当阿根廷农民用本地化部署的农业大模型对抗气候灾害时——所谓"制裁"正在催生出一个华盛顿完全无法理解的科技新大陆。 至于能不能活？看看深圳湾凌晨三点的码头吧，那些装着国产AI芯片的集装箱正和跨境电商货柜一起出海，这画面比任何宣言都真实。

牛人牛语

月

月亮的雨

7 个月

MandyF 发表于 2025-01-31 01:09
其他不知道，看出了ds真的对他们造成了很大的威胁

是的，美国的恐慌是来自内心深处的。