OpenAI称有证据显示DeepSeek存在侵权行为

今日头条
Toutiao
最新回复:2025年1月30日 2点20分 PT
  返回列表
81016 阅读
89 评论
金融时报/彭博社/CNBC

中国科技公司DeepSeek在美国人工智能行业引发的剧烈震动已经持续数日,一些不同的声音正在不断传出。伦敦金融时报周三(1月29日)报道说,美国人工智能聊天机器人ChatGPT的开发者OpenAI指出,它已经发现证据表明,中国初创公司DeepSeek使用OpenAI专有模型来训练自己的开源聊天机器人。这给那些怀疑这家中国公司可能存在侵犯知识产权行为的人提供了新的佐证。

金融时报说,这家总部位于美国旧金山的ChatGPT制造商表示,它已经看到了一些有关DeepSeek公司开发者通过“蒸馏”(distillation)技术侵权的证据。

所谓“蒸馏”技术是指开发者使用更强大的模型输出训练小模型,从而以更低的成本取得更高性能的一种做法。

金融时报说,这是业界常见的做法,但问题是,DeepSeek开发的智能聊天机器人与OpenAI的ChatGPT属于同类竞争产品,它的这种做法涉嫌侵犯OpenAI规定的产品使用条款,可能构成侵权。

报道引用一名与OpenAI关系密切人士的话说,“问题是你(将其从平台中取出)为了你自己的目的而创建自己的模型。”

特斯拉首席执行长埃隆·马斯克(Elon Musk)据报近日也指出,他不相信DeepSeek所说的AI研发能力,也怀疑这家中国公司拥有的英伟达显卡数量要比它公布的数量多很多。

科技信息网站“TheVerge.com”周三刊文说,OpenAI和美国科技巨头微软公司正在调查这家中国竞争对手是否使用OpenAI的API(应用程序界面)将OpenAI的人工智能模型集成到DeepSeek自己的模型中。消息人士称,微软安全研究人员在2024年底发现大量数据通过OpenAI开发者账户被泄露,微软公司认为这个账户与DeepSeek存在关联。

金融时报说,OpenAI拒绝发表更多的评论,或提供详细的证据。该公司的产品使用条款明确规定用户不能“复制”其任何服务或“使用其输出开发与OpenAI竞争的模型”。

DeepSeek发布的R1推理模型令市场、投资者和美国硅谷的科技公司都感到惊讶。这款模型成本低,排名高,水平堪比美国领先的模型。

DeepSeek的模型上周末发布后触发美国科技股周一大跌。美国AI芯片巨头英伟达股票下跌17%,其市值蒸发近6000亿美元。投资人担心,美国通过巨额投资发展AI的模式可能存在很大的泡沫,这会引起市场对它们的价值重新评估。不过,周二,市场的焦虑有所平复,纳指回升400多点,英伟达的股票也反弹九个百分点。

另据美国财经媒体彭博社消息,一位知情人士说,OpenAI及其合作伙伴微软去年调查了据信是DeepSeek使用OpenAI应用程序编程接口(API)的账户,并因怀疑其使用蒸馏技术违反服务条款而取消了其访问权。

金融时报说,微软谢绝置评,OpenAI也没有很快恢复置评请求。DeepSeek可能因中国春节放假而没有对其置评请求作出回应。

美国总统特朗普的人工智能和加密货币事务顾问戴维·萨克斯(David Sacks)早些时候表示,“有可能”发生了知识产权盗窃事件。

萨克斯周二接受福克斯新闻采访时表示,“人工智能中有一种技术叫做蒸馏”,说的是一个模型在从另一个模型中学习的过程中能够从母版模型中汲取知识。

金融时报引用萨克斯的话说,“有大量证据表明DeepSeek所做的就是从OpenAI的模型中提取知识,我认为OpenAI对此是不会满意的。”

DeepSeek称,自己仅使用了2048个英伟达H800显卡,并花费了560万美元来训练具有6710亿个参数的V3模型,这只是OpenAI和谷歌训练同等规模模型费用的一小部分。

一些专家表示,该模型生成响应表明它已经接受了OpenAI GPT-4输出的训练,这违反了其服务条款。

业内人士表示,中国和美国的人工智能实验室使用OpenAI等公司的输出结果是一种常见的做法,这些公司已花钱请人教他们的模型做出听起来更像人类的回答。

内部人士说,这种做法即昂贵又耗费人力,小公司通常会采用“搭便车”的方法做这项工作。

OpenAI在最新声明中表示,“我们知道(中国)的公司以及其他公司正在不断尝试从美国领先人工智能公司的模型中提炼(它们需要的东西)。”

这一做法凸显了热衷于保护其技术优势的公司所面临的困难,金融时报说。

媒体:微软和OpenAI调查DeepSeek是否以不正当手段获取数据

据知情人士向媒体透露,微软和OpenAI正在调查DeepSeek 是否以未经授权的方式获取了源自OpenAI技术的数据输出。与此同时,美国海军在一封电子邮件种已指示其成员避免使用中国DeepSeek的人工智能技术。

彭博社周二引述知情人士报道,微软和OpenAI正在调查DeepSeek 是否以未经授权的方式获取了源自OpenAI技术的数据输出。

微软的安全研究人员去年秋季观察到他们认为可能是与DeepSeek有关联的个人,使用了OpenAI应用程序编程接口(API)窃取大量数据。

软件开发人员可付费得到API使用许可证,将OpenAI的专有人工智能模型集成到他们自己的应用。知情人士称,作为OpenAI技术合作伙伴和最大投资者的微软,已将这个情况通知了OpenAI。

中国初创公司1月20日发布的人工智能模型DeepSeek-R1,在测试表现、训练成本和开源开放程度等多个基准测试中均超越美国OpenAI公司的最新模型o1,但成本仅为o1的三十分之一。

苹果应用商店下载量超越ChatGPT,DeepSeek究竟何方神圣?

特朗普总统的 AI 主管萨克斯(David Sacks)周二表示,有大量证据表明DeepSeek依靠 “萃取”OpenAI 模型的数据来帮助开发自家技术。

OpenAI回复媒体询问称,中国和其他国家的公司一直在试图复制美国领先研发者的程序,但没有点DeepSeek的名。OpenAI还表示正在“采取措施保护我们的知识产权”。

美国海军禁用DeepSeek

据美国全国广播公司(CNBC)报道,美国海军在一封电子邮件种已指示其成员避免使用中国DeepSeek的人工智能技术。邮件中称,由于“与该模型的来源和使用相关的潜在安全和伦理问题”,DeepSeek的AI不得“以任何形式”使用。

美国海军发言人确认了这封邮件的真实性,并表示这是根据海军信息主管部门的生成式人工智能政策发布的。

该电子邮件于上周五上午发送至OpNav(海军作战部)分发列表,表明这是一次全员通知。该警告基于海军航空兵器中心部门网络工作队经理的一份咨询报告。

备忘录中表示,收件人应“避免下载、安装或以任何形式使用DeepSeek模型。”

周一(26日),总部位于杭州的新创公司DeepSeek,其人工智能助理超越竞争对手ChatGPT,成为美国苹果APP商店下载排行第一的免费应用程式。

f
fake6park
1 楼
爬遍了整个互联网,和所有开源平台,然后关起门挣钱,openai现在想起来还有个东西叫侵权?要点脸吧!
铗归来
2 楼
DeepSeek 涉嫌从留园网友的灌水中提取训练资料,属于侵权!
r
rimm
3 楼
硅谷巨头也要背弃平等公开竞争,向右急转,难道不是好消息吗?
不明智
4 楼
不管幻方的DS是否是寄生在openAI 和llama 等模型上 但从DS对美股的打击上看 幻方事先做空美国 就已经赚了百亿
走西口
5 楼
进口商增加的成本当然就转到消费者的头上。物价会马上跳升!
不明智
6 楼
不管幻方的DS是否是寄生在openAI 和llama 等模型上 但从DS对美股的打击上看 幻方事先做空美国 就已经赚了百亿 所有在在美国加拿大有养老金,有股票投资的人 包括五毛狗逼 都被幻方量化收割了
A
AceOp
7 楼
Open AI 的老大想了一晚上就还是这么一招 唉
d
danial
8 楼
查原始代码。 这是开源模型 [1评]
这是神马情况
9 楼
哈哈,真的假不了,假的真不了!党国抄袭成风,是人皆知!
系统不忙了
10 楼
看着吧,个别人不守规矩最终会导致开放的AI搞不下去
a
alien
11 楼
Distillation 蒸馏法OpenAI 2023年年头就公布了这方法对于小模型研发很省钱和时间。deepseek一直不公布用什么东西做training, 只公布了inferencing 怎么便宜,有心避重就轻。但是不可抹杀deep seek的优化方法。其中PTX 优化在assembly level对于所有公司来说没用,但是软件reinforcement training 跳过reward point 是一大好处。 Meta这个星期已经把这方法弄到ad advertisement 了,应该对于其他小公司有好多好处
松泻
12 楼
人家是开源的,一看就知道是否抄的,还不简单?这开源码,有人说他们代码和算法是抄的吗? [1评]
a
alien
13 楼
OpenAI 偷别人数据是当时没协议,告不了,但是现在好多公司都设置了保护,也有法律文件定义什么叫偷,Openai再偷就是违法,可以打官司。但是如果deep seek真的拿了open AI 数据做模型而且是竞争性的,而且OpenAI有法律条文声明了,那是被抓不冤。当然OpenAI的法律声明有没有美国法律的支持是另外一回事,不是出了声明在先就合法。有本事就来美国上法庭告。 但不可以用Openai偷其他人数据和deep seek偷OpenAI数据做竞争性模型来比。比不了 [2评]
a
alien
14 楼
你先了解一下OpenAI说偷的是偷什么再讨论这问题
a
alien
15 楼
查不了的。如果在OpenAI已经下载的数据可以存起来。不用每次query OpenAI. query over internet is too slow.
真是太烦人
16 楼
24楼,你看见库存在你家了吗?台把。
m
markhammer
17 楼
这种无赖式的诋毁最没意思。有证据就起诉是西方人最常用的方法能得到天价赔偿,这次怎么不起诉?散布猜测的想法抹黑对手真的很没出息。美国完蛋了。
R
RM
18 楼
笑了,确定要用这借口? 这样简单的话意味着任何人都可以自行低成本用大公司资料训练出自己的AI,对美国AI吹牛业界更是毁灭性打击。
意见没
19 楼
不用两个公司之间单独的协议吧?你去很多网站,人家都是明写了若下载、引用的版权问题。
g
granddad
20 楼
先问你Open AI的数据哪来的?就拿三国演义来举例吧,中国各版本的三国演义对OpenAI开放版权啦?更别说世界各国浩如烟海的网络文献。你可以阅读,不等于你可以大量引用和做大模型研究。这么扯的话,就没有一家没有侵权的
小龙人他爹
21 楼
没证据你说个屁啊
N
Nadal1991
22 楼
deepseek 没回
南安仓
23 楼
你们真的用deepseek做过题吗?二阶导数错一半。 [1评]
n
newerer
24 楼
笑了 Open AI到处爬人家数据,竟然有脸说别人侵权???
n
newerer
25 楼
OpenAI 是网上爬人家数据 它自己的数据又没有贴在网上 请解释一下DeepSeek如何取得open AI的数据?
n
newerer
26 楼
: 求你了,狗粮 你这种底层就别谈AI了 丢人现眼
n
newerer
27 楼
煞笔狗粮 你以为是生物化学,要复制出来? 一种算法,发表出来就一目了然 煞笔底层 不要丢人现眼了
E
Edmondon
28 楼
傻逼狗粮媒体终于想出对策了:打不过就抹黑,证据都不需要
k
ktvguy
29 楼
就是就是 这一波AI是DeepSeek前两年突然横空出世 连带华为GPU横扫. 然后这个月突然出现呢个什么OpenAI chatgpt 和 Nvidia!美帝输得底裤都没了. 就跟无耻的Tesla, 看到东大出现了BYD,蔚小李,就跟在后面狂抄.然后说自己怎么怎么NB..可恶啊.
d
dhy1998
30 楼
油汰计划用AI割全世界韭菜,被厉害锅用高级盗版搅黄啦。厉害锅使用啦不诚实手段,但比你油汰捅屁眼GPT(那个openAI 奥特曼还有个丈夫)模型厉害,爱咋咋地
犬涼不高兴
31 楼
臭不要脸的奴隶主文明招收了一批臭不要脸的死妈狗粮,对于超过自己的竞争者进行了臭不要脸的抹黑
b
bullapex
32 楼
每次 中国有好的东西。西方国 都是借口 骂中国
真正热血中国人
33 楼
本来就应该开源,知识产权就是资本手段,对人类无益,应该限制获利的总算。
j
jingfei05
34 楼
那你用chatgpt o1 啥得也去做做看么。。。比较下。真都对了,还人干嘛。。。
开心小黄人
35 楼
现在的人是傻逼吗?主流媒体这么骗人。既然有蒸馏技术。ChatGPT自己蒸溜自己。或者ChatGPT蒸馏deepseek不就成本只有千分之一了。这么弱智的理由忽悠傻逼啊
开心小黄人
36 楼
AI都是华人。自己抄自己?
p
ppp66
37 楼
facebook 用书籍盗版网站 libgen的数据来训练模型不说了。
a
anywho
38 楼
熟悉的伎倆, 熟悉的劇本 熟悉的胡扯! Fuck off!
e
eickegao
39 楼
蒸馏技术很多公司在用。包括google的AI也用过openAI的数据来蒸馏。
金山浪人
40 楼
说得“一针见血”!你卖服务,只要别人付钱了,只要不违法你管不到拿去做什么。况且那么好的事情OpenAI为什么不自己蒸溜自己???打不过就使下三滥的招污蔑,丑国真的黔驴技穷了。
a
anywho
41 楼
大家記得ClosedAI 的吹哨人嗎? 就是揭露ClosedAI 抄襲偷別人 而被消失的、 可憐他的父母還在為失去 自己的兒子而奔波投訴、 賊喊捉賊ClosedAI 真的無耻! 看看油管多少美國人怒訴它!
e
eickegao
42 楼
很有意思的一点是。如果只靠蒸馏,能否解释一下,人家为啥答案比你的高啊? 我蒸馏了你的数据,为啥我得分要比你高? 这说明ds肯定还有其他手段,蒸馏不是决定因素。
s
slzcmu
43 楼
又来诬告中国公司剽窃美国没有的东西了
m
mamamiyadd
44 楼
大聪明,你已经花了大钱完成了模型构建,自己蒸馏自己不是脱裤子放屁吗?只有没有原始数据才蒸馏别人来加快速度,不说了,难怪来这里智力下降 哈哈哈
y
ytm234
45 楼
特朗普總統的 AI 主管薩克斯說,有大量證據表明DeepSeek所做的就是從OpenAI的模型中提取知識.....然後..OpenAI拒絕發表更多的評論,或提供詳細的證據。呵呵!骯豬越來越髒了。
开心小黄人
46 楼
: 你仔细看看蒸馏技术吧。蠢货
g
gotid
47 楼
称有证据显示
g
goodboy22
48 楼
反华狗粮在网络上的行为其实挺有规律的,往往一开口就带有强烈的情绪化倾向。以下是他们的一些网络“日常”: 1. **凡事必骂,不管好坏**:不论国内发生什么,他们都会找角度批评,甚至曲解事实。如果是好消息,比如经济增长、科技成就,他们会立刻说数据造假、表面功夫;如果是坏消息,比如一些社会问题、负面事件,他们更是添油加醋地大肆宣扬,努力把事情夸张成“中国崩溃”的预兆。 2. **选择性盲视,双重标准**:这类人对国外的负面问题选择性忽略,而对国内的问题放大解读。比如当国外出现类似的社会问题(比如种族歧视、治安事件、环境污染等),他们会一带而过,甚至替其开脱;而一旦国内出现类似情况,就会大肆攻击,仿佛这些问题只有中国才有。 3. **迷恋“外国月亮”**:很多“逢中必反”者有明显的崇洋情结,认为外国一切都比国内好。比如教育、医疗、法律制度等,他们都会认为西方国家无懈可击,仿佛没有任何缺点。即便被其他人指出国外同样存在类似问题,他们也会找各种理由为外国辩护,或者干脆忽视。 4. **传播“危言耸听”的假新闻**:这类人热衷于转发各种小道消息和未经证实的负面新闻,尤其是那些“看起来像真的”假消息。他们不在乎消息的真实度,只要能把国内形象描绘得更差一些,他们就会毫不犹豫地转发、评论。 5. **恶意调侃国内生活**:在一些和日常生活有关的话题里,比如房价、食品安全、教育等,他们的评论常常带有恶意的调侃,比如用“地狱模式”“土皇帝”之类的词汇,努力让人觉得在国内生活是一种痛苦的折磨。甚至在一些普通的生活趣事或网友分享的幸福时刻下,他们也会故意“泼冷水”。 6. **喜欢攻击支持国家的网友**:这些“逢中必反”者常常会对表达爱国、对国家有正面评价的网友进行人身攻击,甚至直接贴上“自干五”“五毛”的标签,认为所有的爱国表达都是“收钱发帖”。在这种对话氛围中,他们通常只攻击,而不做有理有据的讨论。 7. **对公共事件落井下石**:一旦发生了公共事件,比如疫情、事故等,这类人往往在第一时间对事件大加批评,完全不考虑事件的客观情况或实际影响。即使事件在积极解决中,他们也会一味强调问题,甚至刻意忽视背后的努力和改变。 8. **时刻提醒自己“与众不同”**:很多“逢中必反”者在网络上有一种“高人一等”的态度,喜欢用冷嘲热讽的口吻,仿佛自己是唯一“看清真相”的人,其他人都是被蒙蔽的“韭菜”。他们甚至会把所有对国内有正面看法的人视作“洗脑的产物”,认为他们缺乏“独立思考”。 这种人往往活跃在一些特定的论坛、社交媒体账号下,喜欢“刷存在感”。他们的言论虽然激烈,但大多片面、主观,主要依赖情绪渲染,难以经得起深度探讨或事实检验。而且他们极少针对实际问题提出建设性意见,更多是在制造分裂、渲染对立。 这些逢中必反的“键盘狗”很是搞笑,一开口就乱喷,口水比脑子多。自己在国外苟活,拿着“狗粮”上网撒泼,碰到点中国的好事就气得牙痒痒,硬要找点黑点才舒服,傻逼呵呵的贱种性格。它们一边骂着中国,一边想方设法蹭热点,博出位,仿佛这样就能靠出卖点儿“节操”证明自己“有国际视野”。结果呢?看清它们的人也就一笑而过,知道不过是些西方势力的小跑腿儿,满口脏话之外没点真材实料。成天顶着“自由”大旗,实则脑袋空空,像只跳梁小丑,连外国的观众都懒得搭理。说到底,这些“反华蛐”活在自己的阴暗角落,像吸血虫一样,自己被啃得连底线都没了,却还妄想“点醒”别人。要真有点骨气,就别靠“黑”混口饭吃,看看它们的“戏码”,除了可笑,也就剩贱嗖嗖了,狗粮死全家,狗粮不得好死。
b
baihe_xianyang
49 楼
兄弟你这样问不是难为傻逼嘛。
f
fck1234
50 楼
又要开始洗衣粉的套路了 百试不爽
活在裆下
51 楼
你这么说也没错,没有前面的人投资的几千亿美元你也不可能做出来deepseek
T
TEC101
52 楼
新冠,华为和新疆,到现在也是大量证据还都不告诉你😂🐸
53 楼
拿出来啊
r
rgws
54 楼
不是大家都在剖析Deepseek吗?它的学习效率有多高是掩盖不了的。有功夫去怀疑侵权,不如拿剖析出来的结果为证。