DeepSeek窃取OpenAI数据？微软正展开调查

大约一个月

5 楼

扯淡。OpenAI数据百分之百来自他人。哪家给过它授权？怎么就从良了，摇身一变，自封数据贞洁检查员了？微软调查？中国可以调查ChatGPT里是否有来自中国的中文数据！

viBravo5

大约一个月

6 楼

国内人居然有这样想法，美国人为什么笨到没想到用别的AI模型数据去训练。国内人还不懂数据就是商品，如果是给个人开发员的账号，下载数据没有授权就转发再生就是剽窃，服务协议上肯定有, 这在美国是常识.

Maui2021

大约一个月

7 楼

墙内鼓励剽窃美国的东西，害海外华人，也不是一天两天了。现在国防院校被拒入境美国，也算是自找的。以后希望不要连ABC都被牵连到。 viBravo5 发表评论于 2025-01-29 09:25:50 这件事如果证据确凿DeepSeek是偷窃OpenAI数据训练其模型，对在AI领域美国华人影响很坏美国要扎紧AI模型数据的篱笆，不让没有授权的数据窃取

tudoutudou99

大约一个月

8 楼

中国的天才都是天下无贼里的美女人才

大约一个月

9 楼

楼下的，open ai 用的是自己在web上抓取的数据， ds则是违反openai授权使用它的输出数据，简单的说就是使用许多账户对ChatGPT进行提问，如何用这些问答来训练自己的模型，这是明文禁止的，这类似于你买票参加展览，然后抄了人家的原创做产品卖钱，这就是偷窃。

大约一个月

10 楼

楼下，OpenAI无权在网上抓捕数据后自己转卖。只是在Web上抓取数据？好轻快的只是。

大约一个月

11 楼

要不然它深陷无数官司

XM25

大约一个月

12 楼

我做的试验支持了这个假设：对两个物理问题给出了一模一样的回答。

worley

大约一个月

13 楼

还是咱们本城最高效，第一时间就指出了DeepSeeK如何克隆ChatGPT的技术细节。美国人反应太慢，还调查了啥啊。连DeepSeek都诚实地回答自己就是ChatGPT。还是华人了解中国人啊。当年，华为号称研发出七纳米芯片，然后美股和台积电也大跌。然后华为就没有下文了。

ca_lowhand

大约一个月

14 楼

openai现在是花钱买数据，成本巨大。ds的未授权蒸馏肯定是侵权了。但ds的技术思路的确是巨大创新，而且开源了。从这方面来说对整个ai行业是巨大贡献。

会

会当凌绝顶1

大约一个月

15 楼

新闻1: OpenAI称有证据显示DeepSeek存在侵权行为。OpenAI在最新声明中表示，“我们知道（中国）的公司以及其他公司正在不断尝试从美国领先人工智能公司的模型中提炼（它们需要的东西）。” 新闻2: DeepSeek窃取OpenAI数据？微软正展开调查。假设，如果，我说的是“如果”，个别人模仿抄袭、偷偷摸摸，难免遭到大家质疑！依靠“不明不白”数据、非国际原创算法、非革命性优化、后发AI开源、修、补、“不明不白”数据、白菜价，等等，并不能说明实质和关键问题！塞克斯说：「很多证据显示，DeepSeek从OpenAI的模型中进行知识蒸馏。OpenAI应该不太高兴。」 AI独角兽Scale AI 执行长 Alexandr Wang日前受访时踢爆，Deepseek拥有大约5万个辉达最先进的H100 GPU，且拥有的数量比外界想像的更多。　　美国AI新创公司Scale AI 执行长 Alexandr Wang 日前接受CNBC采访接爆料，Deepseek拥有大约5万个英伟达最先进的H100 GPU。　　米尔斯说，这是一场打地鼠游戏。　　耶鲁大学管理学院副院长索南菲尔德（Jeffrey Sonnenfeld）也告诉CNN， DeepSeek崛起要嘛是“史普尼克时刻”（Sputnik Moment）时，要嘛是波坦金时刻（Potemkin Moment）。亦即，DeepSeek可能带来真正的破坏性，也可能是欺骗性的，依赖于出口制裁之前囤积的辉达芯片和其他芯片。

大约一个月

16 楼

典型的强国人，你真不该留在美国。 open AI的用户协议写得很清楚，不许这样做。为什么其他的美国AI公司没有这样做就是因为遵守用户协议。使用open AI的输出数据，相当于省去了前期数据提炼的巨额工作，所以只要6,000,000就能搞出来一个模型了，可这就是偷。 —— 胡冲发表评论于 2025-01-29 09:35:18 楼下，OpenAI无权在网上抓捕数据后自己转卖。只是在Web上抓取数据？好轻快的只是。

大约一个月

17 楼

哪条OpenAI的协议写得很清楚？

xihuahua

大约一个月

18 楼

Deepseek 根本不是不是出场公司、是一家实力雄厚的对冲基金、他们二一年前就已是英伟达显卡亚洲区最大客户之一、在这次股灾中应该获利非常巨大

注

注册怎么这么难

大约一个月

19 楼

令胡冲发表评论于 2025-01-29 09:28:34 扯淡。OpenAI数据百分之百来自他人。哪家给过它授权？怎么就从良了，摇身一变，自封数据贞洁检查员了？微软调查？中国可以调查ChatGPT里是否有来自中国的中文数据！ ------------------------------------------- 扯淡的是你吧。OpenAI数据也存在侵权问题所以现在也在官司中、到目前为止还没解决完，但OpenAI大部分数据是买或被授权，比如与版权商的合作数据或标明引用出处的特定数据及公共开放的数据. 都存在剽窃数据行为、微软也在调查OpenAI，怎么着微软调查DeepSeek不可以吗？

xihuahua

大约一个月

20 楼

Deep seek 并非初创公司、公开新闻显示他们2021年就拥有数以万计的英伟达最新显卡

莫

莫言无语

大约一个月

21 楼

原来花钱只是买了些盗窃用的工具。

xihuahua

大约一个月

22 楼

deep seek是大陆实力最强的量化对冲基金

大约一个月

23 楼

楼下强国令狐虫，看看chatgpt的回答，然后你去问问ds咋说。 OpenAI服务条款何处写明不允许使用输出数据用于训练自己的AI模型？ OpenAI 的服务条款在 “Restrictions”（限制）部分明确规定，用户不得使用 OpenAI 生成的输出数据来训练或开发 AI 模型。具体来说，该条款通常包含如下内容（可能会随 OpenAI 政策更新而变化）： • 禁止使用 OpenAI 服务的输出来开发、训练或改进任何人工智能模型。 • 禁止将 OpenAI 的输出数据用于创建竞争性 AI 服务。此外，“Intellectual Property”（知识产权）和 “Use of Content”（内容使用）部分可能也会涉及 OpenAI 对其生成内容的使用限制。要获取最新的具体条款，可以直接访问 OpenAI 的 Terms of Use 页面。

randomspot

大约一个月

24 楼

AI领域使用数据训练模型， copyright目前是棘手的问题 OpenAI / Microsoft目前都被诉讼，使用他人的数据为自己盈利；有很多潜在的问题尚需法律解决，比如，使用他人数据训练出来的结果，本身也成了数据。使用权怎么定义。

一

一支鞋飞了

大约一个月

25 楼

只要你比他先进就一定有问题，其实就这样了，就跟晚年的爱迪生四处为专利打官司一样，旧这么回事儿吧

randomspot

大约一个月

26 楼

很有可能，闭源模型发展道路会越走越窄，这对人工智能的发展，是很有利的

bluetag

大约一个月

27 楼

DS在对话时多次声称自己是GPT，来自Open AI，网上到处都是截图，这个很难抵赖了，大模型的成本本来主要就是数据和训练，不是源代码，DS这样搞成本低一点也不奇怪，虽然实际成本很可能还是比他们公布的高很多，但Open AI到时候很依照他们公布的成本来计算损失，DS肯定惨到有苦说不出。

蓝

蓝天大地

大约一个月

28 楼

傻逼五毛，中国当然可以调查ChatGPT里是否有来自中国的中文数据！问题是，他们之间签了协议吗？你偷还偷出理由了？ ------------------------------------------------- 令胡冲发表评论于 2025-01-29 09:28:34 扯淡。OpenAI数据百分之百来自他人。哪家给过它授权？怎么就从良了，摇身一变，自封数据贞洁检查员了？微软调查？中国可以调查ChatGPT里是否有来自中国的中文数据！

蓝

蓝天大地

大约一个月

29 楼

这不就是拿着我幸幸苦苦做出来的3D地球模型，然后在澳洲上面多加点森林，让整个球变得更好看一些吗？没有老子的球，你能做出这个让澳洲更绿的球吗？（哈哈哈，怎么觉得这么拗口）啊哈哈哈哈哈哈哈。

randomspot

大约一个月

30 楼

法律上这个问题需要解决使用未经他人正式授权使用的数据训练出来的结果，本身也成了数据，这样的结果数据，是否可以受到法律的保护，即使自己已经声明不允许别人使用自己的训练结果。有意思我都推测是，未来的开源模型是大势所趋

groogle

大约一个月

31 楼

就知道有后续若想人不知除非己莫为

bluetag

大约一个月

32 楼

DS偷的可不是网上的原始数据，而是structured数据，OpenAI处理过带标注的训练数据, 不要刻意混淆。

泥

泥川

大约一个月

33 楼

Steve Jobs说，good artists copy, great artists steal。当年苹果得以成功的图形界面，鼠标都是借鉴他人，不是自己原创。任何人使用AI，都是喂给AI问题，然后用AI给出答案。deepseek所做的也不过如此，不过是批量的，也付了该付的钱，当然不是偷。如看高手下棋，学了几招，这叫学习，不叫偷。根据输入输出，破解黑匣子，是科技界常用的方法，叫Reverse Engineering,逆向工程。deepseek确实用了逆向工程方法。我可以用你的，你也可以用我的，公平合理。当然这就是AI模型不可能垄断的原因，因为你必须让人用你的输出。不管出什么新模型，别人能逆向工程把你学个89不离十。

worley

大约一个月

34 楼

偷就是偷，中国人还偷得理直气壮。 OpenAI在Term of Service 明确禁止了这种行为。如果允许偷数据，以后谁还会雇佣大量数据工程师去整理数据和答案？谁还会去购买数据和答案？大家都去偷其它人的数据免费用

bluetag

大约一个月

35 楼

楼下太扯了，使用OpenAI 的接口，是白纸黑字签了协议的，明确说不能用来做竞争用途，否则就是偷，DS官司吃定了。

河

河西海龟

大约一个月

36 楼

B小偷偷了A小偷偷来的东西。A小偷ba jin

蟹

蟹粉小笼包

大约一个月

37 楼

网上那些问DSwhat model are you回答是chatgpt的截图大概率是PS的，狗粮们集体高潮了，呵呵。。。

蟹

蟹粉小笼包

大约一个月

38 楼

今天英伟达股票目前为止跌了接近6%了，狗粮们还看不出来问题么。。。

阿

阿宽

大约一个月

39 楼

很好，继续卡脖子，从当初原子弹、氢弹，空间站到后来的航母、5G、GPS，美国人就是不长记性，如果不卡脖子，中国也许成不了世界第一，如果卡脖子，无论卡啥，中国都必将成为世界第一，因为没有一个公司的产品可以和举国体制抗衡。

5mslj

大约一个月

40 楼

让，子弹，再，飞，一会儿五毛们

河

河西海龟

大约一个月

41 楼

故事是：B小偷偷了A小偷偷的东西，A小偷大喊抓贼，然后A小偷他爸C大偷正展开调查。

TXZS

大约一个月

42 楼

你的API不正是你提供的服务吗？你抱怨什么？再说了，如果真是你的数据，别人的结果比你的好，你不觉得丢人吗？天天撒泼耍赖，什么时候才能长大变成正常人啊？！

荒

荒野猎人

大约一个月

43 楼

投资仅仅500万？两个月完成训练？骗三岁小孩？

大约一个月

44 楼

泄粪小脓包不懂股市行情，AI股本来就被市场认为处于虚高，大量做空机构等待机会而已，随着ds偷窃的事实进一步水落石出大家就会明白nvda的硬件还是必需品。