刚刚回家的路上听了一耳朵,挺有意思的。 -------------------- 主持人Kelly问OpenAI的官员:你的公司说正在调查DeepSeek是否不正确的使用了OpenAI data? OpenAI官员:我们正在评估what may or may not have occurred. 然后提到了distillation这个事物,说这个事物很复杂。他们要调查是否DS sent了大量的东西到ChatGPT,得到ChatGPT的回应后,带着information离开,然后用这些information去制作了DS自家的产品。 主持人这时候提了一个很有见解的问题:DS possibly access your data这件事,跟你们公司自己train ChatGPT on other people's work without their permission,两者的差别在哪? OpenAI官员打了一个比方来回答:如果我去图书馆借了一本书,看完之后还了书,但我获得了信息留在我的脑子里。而另外一种情形是,我去图书馆借了一本书,借了书不还,然后把这本书的作者改成我自己。这两者显然不同。 话到此,官员话锋一转说:但是,更重要的是中国美国之间现在显然是有一场激烈的AI 竞争(But I think the big point is there is a real competition between US and China)。 ---------------------------- 我的理解是,官员在抱怨说我们OpenAI用了纽约时报、百科全书或者其它大模型来训练ChatGPT,我们没有说这是我们自己的东西(当然死掉的吹哨人有不同看法);DS如果用了我们的ChatGPT来获取了资料并训练了DS,就等于借书不还、还把书的作者改了。
mtwash 发表于 2025-01-30 20:11 刚刚回家的路上听了一耳朵,挺有意思的。 -------------------- 主持人Kelly问OpenAI的官员:你的公司说正在调查DeepSeek是否不正确的使用了OpenAI data? OpenAI官员:我们正在评估what may or may not have occurred. 然后提到了distillation这个事物,说这个事物很复杂。他们要调查是否DS sent了大量的东西到ChatGPT,得到ChatGPT的回应后,带着information离开,然后用这些information去制作了DS自家的产品。 主持人这时候提了一个很有见解的问题:DS possibly access your data这件事,跟你们公司自己train ChatGPT on other people's work without their permission,两者的差别在哪? OpenAI官员打了一个比方来回答:如果我去图书馆借了一本书,看完之后还了书,但我获得了信息留在我的脑子里。而另外一种情形是,我去图书馆借了一本书,借了书不还,然后把这本书的作者改成我自己。这两者显然不同。 话到此,官员话锋一转说:但是,更重要的是中国美国之间现在显然是有一场激烈的AI 竞争(But I think the big point is there is a real competition between US and China)。 ---------------------------- 我的理解是,官员在抱怨说我们OpenAI用了纽约时报、百科全书或者其它大模型来训练ChatGPT,我们没有说这是我们自己的东西(当然死掉的吹哨人有不同看法);DS如果用了我们的ChatGPT来获取了资料并训练了DS,就等于借书不还、还把书的作者改了。
mtwash 发表于 2025-01-30 20:11 刚刚回家的路上听了一耳朵,挺有意思的。 -------------------- 主持人Kelly问OpenAI的官员:你的公司说正在调查DeepSeek是否不正确的使用了OpenAI data? OpenAI官员:我们正在评估what may or may not have occurred. 然后提到了distillation这个事物,说这个事物很复杂。他们要调查是否DS sent了大量的东西到ChatGPT,得到ChatGPT的回应后,带着information离开,然后用这些information去制作了DS自家的产品。 主持人这时候提了一个很有见解的问题:DS possibly access your data这件事,跟你们公司自己train ChatGPT on other people's work without their permission,两者的差别在哪? OpenAI官员打了一个比方来回答:如果我去图书馆借了一本书,看完之后还了书,但我获得了信息留在我的脑子里。而另外一种情形是,我去图书馆借了一本书,借了书不还,然后把这本书的作者改成我自己。这两者显然不同。 话到此,官员话锋一转说:但是,更重要的是中国美国之间现在显然是有一场激烈的AI 竞争(But I think the big point is there is a real competition between US and China)。 ---------------------------- 我的理解是,官员在抱怨说我们OpenAI用了纽约时报、百科全书或者其它大模型来训练ChatGPT,我们没有说这是我们自己的东西(当然死掉的吹哨人有不同看法);DS如果用了我们的ChatGPT来获取了资料并训练了DS,就等于借书不还、还把书的作者改了。
mtwash 发表于 2025-01-30 20:11 刚刚回家的路上听了一耳朵,挺有意思的。 -------------------- 主持人Kelly问OpenAI的官员:你的公司说正在调查DeepSeek是否不正确的使用了OpenAI data? OpenAI官员:我们正在评估what may or may not have occurred. 然后提到了distillation这个事物,说这个事物很复杂。他们要调查是否DS sent了大量的东西到ChatGPT,得到ChatGPT的回应后,带着information离开,然后用这些information去制作了DS自家的产品。 主持人这时候提了一个很有见解的问题:DS possibly access your data这件事,跟你们公司自己train ChatGPT on other people's work without their permission,两者的差别在哪? OpenAI官员打了一个比方来回答:如果我去图书馆借了一本书,看完之后还了书,但我获得了信息留在我的脑子里。而另外一种情形是,我去图书馆借了一本书,借了书不还,然后把这本书的作者改成我自己。这两者显然不同。 话到此,官员话锋一转说:但是,更重要的是中国美国之间现在显然是有一场激烈的AI 竞争(But I think the big point is there is a real competition between US and China)。 ---------------------------- 我的理解是,官员在抱怨说我们OpenAI用了纽约时报、百科全书或者其它大模型来训练ChatGPT,我们没有说这是我们自己的东西(当然死掉的吹哨人有不同看法);DS如果用了我们的ChatGPT来获取了资料并训练了DS,就等于借书不还、还把书的作者改了。
AI content and any works created solely by AI cannot be copyrighted in the United States. 这个官员的采访我也听了,他其实根本没有站得住脚的依据来指责deepseek抄袭,也说了这个distillation是行业里的一个普遍做法,最终把谈话拉回中美AI竞争,我们要更多的钱,stargate非常好。
AI content and any works created solely by AI cannot be copyrighted in the United States. 这个官员的采访我也听了,他其实根本没有站得住脚的依据来指责deepseek抄袭,也说了这个distillation是行业里的一个普遍做法,最终把谈话拉回中美AI竞争,我们要更多的钱,stargate非常好。 ganymede 发表于 2025-01-31 13:33
Deepseek刚创作的金句: 美国国家安全和萝莉岛有什么联系? US national security is like those bitches on Orgy Island—any American politician can use it at will, as long as their corporate conglomerate keep pushing them.
--------------------
主持人Kelly问OpenAI的官员:你的公司说正在调查DeepSeek是否不正确的使用了OpenAI data?
OpenAI官员:我们正在评估what may or may not have occurred. 然后提到了distillation这个事物,说这个事物很复杂。他们要调查是否DS sent了大量的东西到ChatGPT,得到ChatGPT的回应后,带着information离开,然后用这些information去制作了DS自家的产品。
主持人这时候提了一个很有见解的问题:DS possibly access your data这件事,跟你们公司自己train ChatGPT on other people's work without their permission,两者的差别在哪?
OpenAI官员打了一个比方来回答:如果我去图书馆借了一本书,看完之后还了书,但我获得了信息留在我的脑子里。而另外一种情形是,我去图书馆借了一本书,借了书不还,然后把这本书的作者改成我自己。这两者显然不同。
话到此,官员话锋一转说:但是,更重要的是中国美国之间现在显然是有一场激烈的AI 竞争(But I think the big point is there is a real competition between US and China)。
----------------------------
我的理解是,官员在抱怨说我们OpenAI用了纽约时报、百科全书或者其它大模型来训练ChatGPT,我们没有说这是我们自己的东西(当然死掉的吹哨人有不同看法);DS如果用了我们的ChatGPT来获取了资料并训练了DS,就等于借书不还、还把书的作者改了。
所以OpenAI剽窃Github代码的案子,吹哨人怎么死的?
剽窃了全互联网,现在摇身一变成了“自己的作品”,OpenAI这些烂人的格局就决定了它们没有前途
DS根本没想跟美国人竞争。是美国人自己知道自己全身都烂光了,指着SpaceX和ChatGPT两个玩意儿当精神支柱。
中国AI不领先,中国还是中国
美国AI不领先了,美国就崩盘了。基于“赢”的凝聚力彻底消失。
Altman把自己的AI首席科学家挤走,卸磨杀驴,输了活该!
OpenAi所有者是微软,Gibhub所有者也是微软。
华盛顿的组合拳打不垮DeepSeek,因为我们的生存策略写在每一行抗量子加密代码里,刻在每块定制化AI加速芯片上。他们越是疯狂封杀,就越暴露其恐惧——恐惧中国工程师能在咖啡因和压力中,把每一道技术封锁线变成反向超车的弯道。这场风暴终将过去,而风暴眼里的DeepSeek,正在改写游戏规则。
然后,Deepseek去图书馆,购买力openAI的检索服务,能够更快的找到书,带了个本子做了笔记,照着样子也做了一个检索,还特别喜欢数学书籍,还专门借了然后写下感想,然后也发布到了网上。
好吧,就算脑子里的东西可以share,那用这种方法来比喻,OpenAI就是借了书,复印了,然后换个包装还把署名改成自己的。。。
😄,他其实偷了别人的知识,不但不跟人分享,也不准别人去看书记下来,因为他怀疑别人用了他服务然后把书的知识都拷贝下来。
只要看一看数据用了多少不就知道是不是吗?OpenAI又不能无线下载数据
不能说是复印,OpenAI自己的心得,人家是看不到的, 就相当于一个老中医行医,他的经验是总结很多原住民的土方得到的,并没有人家的授权。 后来他带了个学生 Deepseek ,但是也藏私,并不教心得,只让学生看他收病人,给处方。 Deepseek 看多了,自己有了心得,总结出来,公开了让大家看。
你太搞笑了
微软只有一部分股权,其他股东的利益呢?
所以主持人那个问题真的有点犀利,一下让OpenAI的那位官员准备的答案不是很合适用上,硬套上去,但逻辑是不太通顺的。
我在想的是,这种带有公关性质的采访,OpenAI难道没跟主持人套招套好问什么问题吗?我知道美国的采访,也是可以提前套好问题,或者给大纲什么的。即便官员的立场不变,针对这个问题也可以有更好的回答,那个图书馆借书的比喻其实有点挫。
对于记者来说,完成任务只能给你工资; 但是在历史转折点,引起争议,能被记住一辈子,也可以改变人生。
比如,文在寅当总统前,最高光的时候,是帮五个中国渔民辩护,这五个渔民是杀人犯,杀了韩国籍船长。 按道理应付就行了,但是他没应付,挖出来了船长虐待船员的历史,帮这五个人避免了无期徒刑。从此也走向了人生高峰
GitHub是微软的,所以GitHub上的代码仓库的知识产权都归微软了?所以微软就可以替用户决定代码可以被CloseAI随便用?你替微软定的这规矩?
微软拥有github 不拥有GitHub用户的代码
这个比喻不对吧,closeai回答问题时也没说,它的知识是从那个网站上拔下来的。
难道不是从网上拔下来的?有谁给他许可了? 中文的网站给他许可了?
刚刚看到一条消息,美国在考虑,STEM里面,可能放松AI专业签证给中国留学生。 也就是说,你要比他牛,才不制裁你。
纯属狡辩,骗不懂AI到底是怎么回事的人。GPT和DS又不是数据库,还看书然后记下来,可笑。NN训练最后是存结构和参数,以为是死记硬背哪。
其实都是打标签,就是利用程序和人工的手段, 给现有的信息做标记,然后让AI能够识别和学习。
至于,想象的输入一个东西,然后保存chat gpt的结果,这个基本不可能。 大面积的套结果,chat gpt可以很容易的发现,并且断开IP.
所以,像这种提高几十倍效率的,必然要自己编写一种跨时代的打标签工具。说白了,光这个他们自己使用的打标签工具发布的话,就足够让scale AI,一文不值。不过也许就是deepseek更大的长处,他们搜集和标记信息的能力更强。
windows的所有者也是微软,那么问题来了,你用windows的电脑上的所有东西都是微软的吗
这个问题,openAI 正官司缠身呢,怎么可能有许可,问这个问题都是外行 不知道所有的 大模型训练的海量数据都是互联网上爬下来的,用来训练都是没有经过许可的 但这种用法是不是违法,因为没有先例,所以还在打官司 OPenAI 用图书馆的例子是有原因的,大众都没有图书的版权,但是可以去图书馆借书, 这个不是违反版权,是 fair use, 所以 openAI也认为自己即使没有授权使用, 也是 fair use,不侵权
从懂王第一任期开始对中国留学生特别是stem专业的visa诸多刁难和阻挠 ,导致很多原本计划赴美的中国理工科毕业生留在了中国,然后八年来中国科技企业爆发式增长和发展有目共睹。 这些毕业生赴美后大概也就在大厂找个坑熬身份结婚买房养娃了。
OpenAI 绝对不是Fair Use。任何Fair Use 必须满足一个或多个以下条件
1 - 非商用,就是不能以此赚钱牟利。OpenAI 用了别人的东西为自己贪婪牟利,每个股东雇员都赚得盆满钵满 2 - 用的很少,少量的quotation 是 Fair Use,OpenAI 是把别人的成果全部吃掉了 3 - 不对原作者造成负面的经济影响,OpenAI 的产品显然对原作者的经济打击很大
图书馆和Deepseek 至少是满足了 1,自己不赚钱
把别人的东西不付钱就拿来,为自己赚钱也叫Fair Use?那是强盗逻辑
这个官员的采访我也听了,他其实根本没有站得住脚的依据来指责deepseek抄袭,也说了这个distillation是行业里的一个普遍做法,最终把谈话拉回中美AI竞争,我们要更多的钱,stargate非常好。
Deepseek刚创作的金句:
美国国家安全和萝莉岛有什么联系?
US national security is like those bitches on Orgy Island—any American politician can use it at will, as long as their corporate conglomerate keep pushing them.
所以Alex Wang在CNBC大放厥词,瞎编什么DS用了5万H100云云,就是因为动了他的蛋糕。
你说不是一回事:
吹哨人: 前 OpenAI 研究员印度裔美国人 Suchir Balaji 于 2024年11 月 26 日在旧金山的公寓中被自杀,未发现外部侵害迹象。Suchir Balaji加州大学伯克利2021年毕业, 曾对使用受版权保护的材料来训练 AI 模型(如 ChatGPT )的行为提出了伦理方面的担忧。作为一名知名的伦理批评者,他公开质疑了使用版权材料训练生成式 AI 模型(如 ChatGPT)的做法。 在接受《纽约时报》采访时,Balaji 指责 OpenAI 的数据收集做法存在危害。他表示:“如果你认同我的观点,那你必须离开公司。”他对 GPT-4 如何利用大量互联网数据进行训练的行为尤其担心。 Balaji 主要关注的是生成式 AI 可能会输出与原始版权作品相竞争的内容。在一篇博文中,他指出,“没有证据表明 ChatGPT 使用的训练数据可以视作合理使用。”他还强调,这不仅仅是 OpenAI 的问题,而是一个涉及整个行业的大问题:“合理使用与生成式 AI 之间的争议,远远超出了任何单一公司或产品。” 近年来针对 OpenAI 的诉讼案件不断,包括《纽约时报》在内的主要媒体指控该公司侵犯了版权。巴拉吉在相关法院文件中被提及 —— 拥有“独特且相关的文件”以支持这些诉讼的人。
剽窃是openAI另一个一项目 【OpenAI应用AI研究员Shyamal Anadkat ,放出了全新多智能体框架——Swarm】
年仅20岁的Swarms Corporation创始人Kye Gomez自曝,「OpenAI侵犯了团队的知识产权」。 Gomez创立的公司Swarms Corporation,专注于开创多智能体革命。OpenAI不仅窃取了名字、代码和方法。而且,从智能体结构的语法,到群体类对象,一切都是从如下代码库中窃取的。https://github.com/kyegomez/swarms
是这个意思😂
笑死了,这比喻很妙
牛人牛语
是的,美国的恐慌是来自内心深处的。