特朗普AI顾问:DeepSeek抄袭ChatGPT

今日头条
Toutiao
最新回复:2025年1月30日 8点29分 PT
  返回列表
39441 阅读
29 评论
美国之音

​​​​​​​

中国新兴科技公司DeepSeek是否抄袭了ChatGPT来制造本周震惊华尔街的人工智能技术?

ChatGPT开发者OpenAI以及美国总统唐纳德·特朗普(Donald Trump)的最高级别AI顾问确实如此认为。 两者都没有披露知识产权盗窃的具体证据,但这些言论可能会引发对一些假设的重新审视,而这些假设使得美国对DeepSeek的先进性感到恐慌。

“有大量证据表明,DeepSeek在这里所做的就是从OpenAI的模型中提炼出知识,”特朗普的AI顾问戴维·萨克斯(David Sacks)星期二告诉福克斯新闻。 “我认为OpenAI对此并不高兴。”

DeepSeek及其开发者幻方量化基金星期三没有立即回复通过电子邮件提出的提问,星期三是中国农历新年假期的开始。

OpenAI在一份声明中表示,中国公司“一直在试图提炼美国领先AI公司的模型”,但并未公开具体点名DeepSeek。

OpenAI的官方使用条款禁止使用所谓“提炼”的方法,可以让新的AI模型通过反复查询已经被训练过的更大的模型来学习。该公司一直在与其业务伙伴微软合作,以识别试图提炼其模型的账户,然后禁止这些账户并撤销其访问权限。微软拒绝向美联社(AP)置评。

OpenAI表示,它还将“与美国政府密切合作,以最好地保护最强大的模型,防止对手和竞争对手窃取美国技术。”

这家旧金山公司本身也被媒体组织、书籍作者和其他人士指控侵犯版权,这些案件目前仍在美国和其他国家的法院审理中。

“提炼会违反大多数服务条款,但讽刺甚至虚伪之处在于,大型科技公司却在强调这一点,”科技投资者兼康奈尔大学讲师鲁兹·费格(Lutz Finger)星期三发表声明称。“在《福布斯》(Forbes)或《纽约时报》(New York Times)的内容上训练ChatGPT也违反了他们自己的服务条款。”

曾在谷歌和领英工作的费格表示,虽然DeepSeek很可能使用了这种方法,但很难找到证据,因为它很容易伪装和避免被发现。

甚至在星期一DeepSeek的新闻震撼市场之前,许多试过该公司人工智能模型的人就注意到,它倾向于宣称它是ChatGPT或引用OpenAI的条款和政策。

“如果你问它你是什么模型,它会说,‘我是 ChatGPT’,最可能的原因是DeepSeek的训练数据是从数百万次与ChatGPT的聊天互动中收集的,这些互动直接被输入到DeepSeek的训练数据中,”前美国国防部官员、目前担任战略与国际研究中心(Center for Strategic and International Studies)瓦德瓦尼人工智能中心主任的格里高利·艾伦(Gregory Allen)表示。

此类声明并不一定意味着知识产权被盗--聊天机器人很容易捏造信息。尽管DeepSeek将称其技术为“开源”,但并未披露其用于训练模型的数据。

“我认为他们做出这一选择的原因非常明显,即他们收集了ChatGPT的内容作为训练数据,”艾伦说。

DeepSeek的很多方面让分析人士感到困惑,他们仔细研究了这家初创公司关于其新模型R1及其前身的公开研究论文。

令华尔街震惊的细节之一是DeepSeek声称训练其人工智能助手背后的旗舰v3模型的成本仅为560万美元,与构建ChatGPT和其他流行的聊天机器人所花费的数十亿美元相比,这是一个低得惊人的数字。

论文称,560万美元的数字仅包括实际训练聊天机器人的费用,而不是早期研究和实验的费用。但这个数字--以及DeepSeek对开发人员相对便宜的费用--让人怀疑美国公司投入巨额资金和电力发展AI是否合理。

DeepSeek也受到限制:美国对最强大的AI芯片实施出口管制。该公司表示,它依赖的是加州芯片制造商英伟达(Nvidia)的一款性能相对较低的AI芯片,而美国并未禁止该芯片在中国销售。但在2022年,幻方量化在社交媒体上发帖称,就在美国限制向中国出口英伟达芯片的几个月前,该公司已经积累了一批性能更强大的英伟达芯片。

新燕山夜话
1 楼
什么混蛋顾问?ChatGPT根本就不开源,没人知道其源代码,怎么抄袭?
v
viBravo5
2 楼
看来这是一次中美AI战中的珍珠港事件
s
supernova13
3 楼
关于“如果你问它你是什么模型,它会说,‘我是 ChatGPT’” 油管上有老美解释过,是正常现象。ChatGPT也曾自称是别的模型。训练模型需要海量数据,借用重叠很正常。就好比有一个著名棋谱,所有下棋的AI都会研究吸收。
l
lue96500
4 楼
1 你设限、不民主、不自由 2 客户资料不安全 3 你抄我的 绝口不提任何技术问题
w
worley
5 楼
代码是用Meta和其它开源软件修改的,数据是从ChatGPT非法提取的。
b
bluetag
6 楼
自称自己是ChatGPT已是铁证,不用抵赖了。
s
speedingticket
7 楼
什么抄袭不抄袭的,无非是看到中国的进步,自己赶不上,只能找些借口,骗人骗己罢了。 ds是在chatgpt的基础上,更进一步,便宜实惠,好用 所有的科研论文都是在别人的成果的基础上,进一步深入研究的结果,论文后面有一大堆参考文献,你能说这个考研论文是抄袭参考文献的? 中国过去没有电动车,你能说中国的电动车都是抄袭外国的?
T
TitaniumAtlas
8 楼
不是抄袭,是偷窃
长剑倚天
9 楼
看来大嘴又被骗了! 什么顾问,解雇他!
T
TitaniumAtlas
10 楼
纯属洗地,从来没有过 supernova13 发表评论于 2025-01-29 18:52:50 关于“如果你问它你是什么模型,它会说,‘我是 ChatGPT’” 油管上有老美解释过,是正常现象。ChatGPT也曾自称是别的模型。训练模型需要海量数据,借用重叠很正常。就好比有一个著名棋谱,所有下棋的AI都会研究吸收。
时不时来看看
11 楼
openai:人家把代码都拿出来了,也没有收费,还要咋样? 是不是让他们闭源,然后还给微软?怎么BillGates的后代也变强权了,以前都是收购,然后慢慢灭掉,比如IE,现在要干啥?
b
bluetag
12 楼
开源不开源并不重要,也没有人会对它的源代码感兴趣,大家感兴趣的是它到底用了什么训练数据,它不公开训练数据,你就没法验证它公开的源代码是不是真实的,也没法验证它声称的成本是不是真实的,如果它的数据是偷来的,那它就没有任何价值,因为它的表现也没有超过之前的模型,顶多就是重复了别人的工作。
骂人不好
13 楼
目前好像主要是集中在DS的数据蒸馏上,对于她的架构和代码并没有什么争议。transformer 是流行的架构,DS的代码是开源的。如果用了别的模型的数据蒸馏之后来训练自己的模型,想想是能够减少数据量,缩短训练时间,对于GPU的性能要求也可以降低。如果用于数据蒸馏的数据没有授权,估计会有问题。
骂人不好
14 楼
OpenAI如果想,可以用她的代码和自己的蒸馏后的数据试一下,看能不能复刻她的那些RL的效果和顿悟的现象。如果完全不能,那就像blue tag网友说的,开源的代码可能就没有什么意义。 不过模型已经训练出来了,周末有时间在自己的机器上装一个小的,可以和其它的模型对比着用,对于一般用户也不是什么坏事。反正我也不会取消ChatGPT的订阅。
爱阅读的人
15 楼
千万别被这些人帶偏了, 中国在2026 初还会上线更牛的,美国自己把产品做的更好才是硬道理. 良性竞争对市场是非常必要的.
泥川
16 楼
微软 AI 平台副总裁 By Asha Sharma 表示:“在 Azure AI Foundry 上使用 DeepSeek R1 或任何其他模型的主要优势之一是开发人员可以快速试验、迭代并将 AI 集成到他们的工作流程中。”“DeepSeek R1 经过了严格的红队测试和安全评估,包括对模型行为的自动评估和广泛的安全审查,以减轻潜在风险。” R1 最初于本月初作为开源模型发布,微软以惊人的速度将其集成到 Azure AI Foundry 中。该软件制造商还将很快推出精简版的 R1,供 Copilot Plus PC 本地运行,我们甚至有可能看到 R1 出现在微软的其他 AI 服务中。
泥川
17 楼
DeepSeek R1已被提炼到 Llama 70B (Meta 开发的AI模型)中,据基准和人工评估,通过R1改进的Llama 70B 比原来的更智能,并且在需要数学和事实精度的任务上表现尤为出色。 使用 DeepSeek-R1 生成的样本对 Llama70B 进行微调的版本,现已在 GroqCloud 上线,用于实时推理。
e
edccde
18 楼
ChatGPT抄袭全部的互联网啊,好几个起诉他侵权的官司还在打呢, 在这里装什么小天真。
河西海龟
19 楼
OpenAI偷全世界的,DeepSeek偷OpenAI的。
z
znggg
20 楼
deepseek用了chatgpt污染的数据源,造成deepseek回答自己是chatgpt,这个在很多LLM中发生过,责任在chatgpt
w
worley
21 楼
中共独裁集团真无耻。 如果可以这么偷数据,美国的其它AI公司为啥不做? 搜索引擎搜集的是公开数据,如果不小心用了有版权的数据,也会吃官司。 这些公开数据价值并不大,因为只有信息而没有答案。 有价值的是“问题,答案,推理思路”,这在互联网上是搜不到的,都是需要购买的。数据科学家还要测试、验证,保证答案正确,保证推理思路正确。 而DeepSeek直接偷数据,成本就是零了。
M
Maui2021
22 楼
既然是抄作业,那架构和训练时间都没意义了。直接作弊,直接当然快。 骂人不好 发表评论于 2025-01-29 19:44:38目前好像主要是集中在DS的数据蒸馏上,对于她的架构和代码并没有什么争议。transformer 是流行的架构,DS的代码是开源的。如果用了别的模型的数据蒸馏之后来训练自己的模型,想想是能够减少数据量,缩短训练时间,对于GPU的性能要求也可以降低。如果用于数据蒸馏的数据没有授权,估计会有问题。
a
ajaychen_2024
23 楼
科普一下 大模型的#蒸馏(Distillation) 及#DeepSeek遭遇的指控 https://youtu.be/jsLdkrM6RB8?si=m4Qz0BJNkk9X0-6K
玻璃坊
24 楼
David Sacks原话没有“抄袭”两个字、也没有暗示抄袭。 不知道标题上抄袭两个字是怎么来的
a
ajaychen_2024
25 楼
“可能,也许 或者,if, maybe”,又拿不出实证,莫须有罢了,AI业界要向投入几千亿美元的资本大佬交待啊
会当凌绝顶1
26 楼
DeepSeek “深度寻找”:蒸馏,偷窃数据, 盗用模型,隐瞒使用大量GPU芯片……
T
TXZS
27 楼
“有大量证据表明。。。” ? 证据在哪儿呢?拿给瓜民们看看呗? 不会又是一袋洗衣粉吧?
T
TXZS
28 楼
今年的葡萄真特么 酸
f
fkcom
29 楼
``