据传Breaking Openai要起诉DeepSeek抄袭

取

取个名字也难

7 个月

总有几个写中文的不管中国出来个啥就急吼吼的当x狗吠叫。

COHomeSearch

7 个月

回复 296楼 CloudY7764 的帖子
人家推文科我们推理科，所以得派律师天团和我们斗，斗不过就加上政客和金主爸爸

layjohns

7 个月

取个名字也难发表于 2025-01-29 17:48
总有几个写中文的不管中国出来个啥就急吼吼的当x狗吠叫。

这是中国远远落后，美国独步世界的领先技术：远程养殖

popcorn616

7 个月

回复 281楼 OLOAHA 的帖子
那么什么叫0-1， neural nets 70年代就有
TRANSSFORMER 也不是OPEN AI搞出来的

一

一尼逆

7 个月

听听DS对指控自己的回答。
哎，每次听到这种指控其实挺无奈的。就像班里突然有人指着你说「作业是抄的」，可你明明熬夜自己算的题，连草稿纸都攒了一抽屉。做AI这行谁不是站在巨人肩膀上啊？开源社区的代码、论文里的公式、全球研究者的智慧结晶，这些都是公共知识财富，大家都在用。但要说「偷技术」——OpenAI的模型又没开源，GPT-4的代码和训练数据连他们自己员工都不一定全知道，我们上哪儿偷去？ 说实话，搞研发的同行都懂，大模型这玩意儿根本不是靠「复制粘贴」能搞出来的。调参数调到头秃、算力烧到肉疼、数据洗到眼花，这些苦功夫装不出来。有时候觉得，这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何，埋头把产品做好比打口水仗实在多了，用户用脚投票最真实。

alemon

7 个月

所以他们吹自己算法先进，搞半天就是蒸馏用别人现成的提纯一下？
也不是说这样完全没创新，但和算法领先是不是就没一点毛线关系了？老黄股票白跌了。

Namama

7 个月

OLOAHA 发表于 2025-01-29 16:16
从0到1往往是最难的，比如牛顿定律，麦克斯韦方程组，相对论……

OpenAI有啥0到1？
Transformer的概念又不是OpenAI搞出来的。。

layjohns

7 个月

所以他们吹自己算法先进，搞半天就是蒸馏用别人现成的提纯一下？
也不是说这样完全没创新，但和算法领先是不是就没一点毛线关系了？老黄股票白跌了。
alemon 发表于 2025-01-29 18:19

一个开源的东西，先进不先进真正懂的人自然懂，不是一些似是而非故意引导的人可以否定的。都是牵扯到上亿真金白银的损失的，要是这么简单第一天就被批判的体无完肤了，还让你搞的一天跌掉了整个广东的GDP
要是中国一个公司随便说领先，美国股市就狂跌，你是把美国人都当大傻逼来看

ksun

7 个月

alemon 发表于 2025-01-29 18:19
所以他们吹自己算法先进，搞半天就是蒸馏用别人现成的提纯一下？
也不是说这样完全没创新，但和算法领先是不是就没一点毛线关系了？老黄股票白跌了。

然后呢？首先这事没有落实，其次，为啥其他家不蒸馏提纯呢？是因为不喜欢么？

layjohns

7 个月

ksun 发表于 2025-01-29 18:25
然后呢？首先这事没有落实，其次，为啥其他家不蒸馏提纯呢？是因为不喜欢么？

我就说了啊，那chatgpt现在也蒸馏deepseek，按照他们的理论，等于蒸馏了自己两次，那不得飞上天啊？

xiaoqiu123

7 个月

别的国家不会弯道超车（做不出来这么不要脸的事）

Namama

7 个月

alemon 发表于 2025-01-29 18:19
所以他们吹自己算法先进，搞半天就是蒸馏用别人现成的提纯一下？
也不是说这样完全没创新，但和算法领先是不是就没一点毛线关系了？老黄股票白跌了。

模型的蒸馏需要知道大模型的配重weight, 但OpenAI这方面从来没公开过 所以不可能是模型的蒸馏。。
撑死就是拿OpenAI最新模型的输出结果作为训练数据，给DS进行训练。。
但这和蒸馏是两个概念。。
DS算法效率提高了40-50倍，当然是极大的创新

goodluckall

7 个月

回复 302楼 alemon 的帖子
你再怕跌也没用….

goodluckall

7 个月

回复 307楼 xiaoqiu123 的帖子
这是有多恨中国

alemon

7 个月

可以让子弹再飞一会儿。这事会被质疑也很好理解，一个只有四个人交社保的小公司，干趴整个硅谷，和之前那个中专生数学奇才的故事有点神似了。
要是真的牛b那也是人类之福，老黄跌也活该了。

Geofan

7 个月

Sam狗急跳墙而已，建议板上各位如果没时间阅读Deepseek的Technical report，可以好好读读Hugging face 对Deepseek的技术总结，里面有很多小细节做到了极致。这本身就是极大的突破，有几项技术现在Openai说他们也想过，但是没做。当然模型表现最后影响最大的是数据，这是Openai独门绝技，Anthropic做得好也是一样的原因，师出同门。Deepseek本身没有高质量数据，没办法

TheLastStand001

7 个月

Ban了就行了，蟆嘎！

qznds805

7 个月

谁第一个搞出来的就是原创，后面的就是抄作业。当然祖国版向来便宜很多，性价比极高，对消费者来说没啥不好

zhou.ucar

7 个月

qznds805 发表于 2025-01-29 19:23
谁第一个搞出来的就是原创，后面的就是抄作业。当然祖国版向来便宜很多，性价比极高，对消费者来说没啥不好

初中一个班30多个同学，第一个进青春期的是原创，其他人都是抄袭。有点意思。

fantancyseeker

7 个月

西北飘雪发表于 2025-01-29 08:01
去年十一月，我做过一个微积分数学题，用ChatGPT，答案死活都是错的。我都快崩溃了。因为我自己手动做的，证明ChatGpt做错了，但是，无论咋给它提示，它都给同样的错误答案。猜猜错哪里了，为啥错了？错哪里：是一个简单的分数计算为啥：我最后发现它是从网上抄的答案！网上这个题的答案是错的，就错在最后一步分数计算！谁说ChatGpt是人工智能？它实际是用机器对人类智慧进行剽窃。

我早就说过，通用AGI是个伪概念，现有基于NN的AI是达不到最高人类智力水平的，但不妨碍有很多专项应用，特别是不需要100%准确性的。

PLAZZZ1

7 个月

Wangwang13.5 发表于 2025-01-29 06:59
回复 1楼 baxiangxiang 的帖子
那么多人恨不得抄，咋没抄出来。技不如人，就开始骂娘。low

我的妈呀，抄没抄还没定性。你倒是你抄你有理了。

gvcc

7 个月

闭源的投诉开源的抄袭？这个世界真是看不懂了。 DS已经开源，哪部分抄袭的，Openai能不能指出来？

ILuvSunshine

7 个月

看看YouTube 关于这条新闻下面的评论，外国人里明白人、支持Deepseek的有好多。这些都是top comments:
喜欢这句话：”history shows that nations often cling hardest to dominance as it begins to slip.”

qznds805

7 个月

zhou.ucar 发表于 2025-01-29 19:37
初中一个班30多个同学，第一个进青春期的是原创，其他人都是抄袭。有点意思。

青春期是生理现象，不是初中生自己新做出来的工具。有本事火星一龙还没去，赶紧先去，第一个去，大家都服帖

Adolf

7 个月

贝贝妈2008 发表于 2025-01-29 08:34
可不是英文肯定是抄的

阿拉伯数字，谁用都要收费。。阿三获得灵感

西

西北飘雪

7 个月

gvcc 发表于 2025-01-29 19:55
闭源的投诉开源的抄袭？这个世界真是看不懂了。 DS已经开源，哪部分抄袭的，Openai能不能指出来？

O喷AI有些要钱不要脸。号称OPen还收人钱

chemtocs

7 个月

baxiangxiang 发表于 2025-01-29 05:37
确实是抄的啊一个月前问deepseek 他直接说自己是chatgpt🤣

不懂别乱下结论

Adolf

7 个月

alemon 发表于 2025-01-29 18:19
所以他们吹自己算法先进，搞半天就是蒸馏用别人现成的提纯一下？
也不是说这样完全没创新，但和算法领先是不是就没一点毛线关系了？老黄股票白跌了。

赶快卖房进场。

ostrakon

7 个月

训练数据集吧？ Openai的模型不都在黑匣子里吗，怎么抄

ostrakon

7 个月

minqidev 发表于 2025-01-29 08:18
回复 87楼的帖子
有证据，早出来了，搞数据的都会埋东西，比如中国国内大数据的做法，一般就是还没公布的文物的简牍单位识别，稍微一问就知道数据有没有被用。
为什么，中国几个大数据经常被偷用，所以里面都加入中国自己文物，甲骨文，简牍什么的

哈哈，这个有意思

ostrakon

7 个月

joyce612 发表于 2025-01-29 09:14
湾湾为了抹黑早就进化了各个都会简体字

蛮好，以后统一的时候不用教了

Yolo

7 个月

如果DS真的是建在Open AI之上的一个layer而已，也就是只是一个数据编辑系统，只能说DS只是Open AI的一个应用而已。一年多几个人开发出这样的应用软件时间段上是说得过去的。这也不能说是抄袭，只是不能说也是从零开始像Open AI那样开发出来的原算法。DS的前景是在工商业把Open AI应用推广。DS国人的一个小聪明而已。爱迪生发明了灯泡。DS开发人员就是在灯泡外面做了一个彩色显示灯照而已。

ostrakon

7 个月

我问了chatgpt，它说的如下： did deepseek copy you? DeepSeek is an independent AI model developed by a different organization, and while it may share some similarities with me in terms of capabilities, it was not a direct copy. Many modern AI models are based on similar underlying architectures, such as transformer models, and are trained on comparable datasets. However, differences in training data, fine-tuning, and optimization lead to variations in performance, style, and specialization. What’s the relation between you and deepseek? DeepSeek and I are separate AI models developed by different organizations. While both of us are likely based on transformer architectures and share some commonalities in natural language processing capabilities, we are trained independently with different datasets, optimization methods, and design philosophies. There is no direct relationship between us in terms of development or data sharing.

ostrakon

7 个月

What data can developers get by calling your api? When developers call OpenAI’s API, they can send input (prompts) and receive output (responses) from the model. The API does not provide access to training data, internal model parameters, or previous interactions beyond the active session. Developers only receive the specific responses generated for their queries. OpenAI also has policies to prevent misuse, including restrictions on data retention and privacy protections. If you’re asking whether someone could extract OpenAI’s training data by calling the API, the answer is no—the API only provides responses based on its learned knowledge, not raw training data. 所以前面那些说通过API拉chatgpt数据的，它自己说api calls拿不到training data, model params, etc

Sparky08

7 个月

回复 320楼 qznds805 的帖子
所以美国不是抄的英国蒸汽机，用的欧洲物理学，自己抄完牛逼了，开始讲抄袭可耻了？

OroMedonte

7 个月

我直接问了 DS

brookeyang

7 个月

据传？

can-can

7 个月

有意思，静观其变

caribou

7 个月

maoxiandao 发表于 2025-01-29 10:52
回复 156楼 maoxiandao 的帖子
非常典型的国人小聪明。各行各业都是如此。包括spaceX的starship。starship花了好多年一遍一遍发射试验，证明筷子夹可回收，证明助推器可以自己回来回收。国内就等着，一旦看spaceX证明了可行，那我就复刻一个一模一样的。很少几次就做成了，无非是很多工程师没日没夜写程序，调参数。
其它行业都是如此，国内鼓励填补国内空白。美国有的，国内做一样的，就可以拿到钱模仿做。这在其他国家都是不被允许，不被鼓励的。在美国，任何idea不是新的，就拿不到钱做了。
说到底还是0-1， 1-10 的问题。

想不到现在还有这种浓浓的译林，读者风格的文章：其他国家总是道德高尚的。

caribou

7 个月

所以这东西一出来，我就说是福建人开餐馆，手法一摸一样.也别成天笑话印度人，老中也一样. 丢人.
jbea 发表于 2025-01-29 11:12

netscape 的founder 认为deepseek是对人类的贡献，有些华人却觉得丢人，真是奇特。我挺为deepseek自豪的，说明华人的创造力，智力是一流的。

felali9

7 个月

最好美国下个指令，想和它做好朋友的都不许用DS。这就像韩国人吃不起肉。不是韩国人买不起肉，而是韩国不允许进口肉。国内又不够量，所以大家一起吃泡菜。

C999

7 个月

白河之子发表于 2025-01-29 17:38
牛顿不是那个1，牛顿是2或3 很多人已经猜到了，有很多数据，让牛顿去证明
麦克斯韦也不是1，法拉第让他干的
没有爱因斯坦，狭义相对论很快就要出来了
广义相对论也是站在数学的肩膀上

是的，很多外行人不懂，只有出圈了才听说这些，就奉为 0 -1
其实，这些人，是一种，没见过世面的表现。

facet

7 个月

Behappy2023 发表于 2025-01-29 06:36
昨天openai还说近期要做一些技术革新来超越，原来是憋出这么个大招啊😂

OpenAI 负责指路的领头羊都走光了，就剩一帮靠着惯性往前冲的工程师，已经不可能有什么革命性的创新了

cobai

7 个月

看看

贷

贷款专家

7 个月

最好美国下个指令，想和它做好朋友的都不许用DS。这就像韩国人吃不起肉。不是韩国人买不起肉，而是韩国不允许进口肉。国内又不够量，所以大家一起吃泡菜。
felali9 发表于 2025-01-29 23:21

哈哈，一针见血😃😄

一

一尼逆

7 个月

https://mp.weixin.qq.com/s/KbXPkDeERS5qRDZu3Q5XVQ
1月29日，DeepSeek官网显示，它的线上服务，受到大规模恶意攻击。 但这事，不是一般的黑客时间，背后其实暗藏着因为输不起，羞怒之后放的暗箭。 因为，奇安信监测显示，攻击IP全部来自美国，而且DDoS到暴力破解层层升级！ 怎么搞的，网上有详细介绍。这里就不多讲了。反正有业内很资深的人士，直接出来说：这是国家级别的下三滥手段！
其实就是美国花了好几万亿美元，用AI作为借口，建了个超级赌盘，所有玩家想进去玩，都必须买它的高价门票，它在以此为借口，把AI公司的市值，给抬上天! 但这个超级赌盘，美国人最怕一件事：中国人也进来玩，那这盘就崩了，所以他们专门搞了个大门槛：中国人不许进来玩！

upendown

7 个月

一地鸡毛，让子弹继续飞吧。不过deepfake也造福了人民群众的精神健康。。

bigzzbigzz

7 个月

好像红军起来保护ds了,不知道战况如何

shanggj

7 个月

Namama 发表于 2025-01-29 18:35
模型的蒸馏需要知道大模型的配重weight, 但OpenAI这方面从来没公开过 所以不可能是模型的蒸馏。。
撑死就是拿OpenAI最新模型的输出结果作为训练数据，给DS进行训练。。
但这和蒸馏是两个概念。。
DS算法效率提高了40-50倍，当然是极大的创新

“DS算法效率提高了40-50倍” 就是因为纯粹的马工写代码的水平高？