神话结束了,微软今天公布了测试结果

老财主说两句
楼主 (文学城)

美国是AI的发源地,大佬无数。这两天,冷静下来的各路人马都纷纷地揭露出了DS的幺蛾子。比如马斯克等。

微软拥有OpenAI一半的股份,Chatgpt的模型用了微软的数据库。你还没听懂,我再说细点:ChatGPT是openAI的产品。

微软对Deepseek做了测试,得出结论:DS偷窃了openAI的模型。

其中一个测试例子很有意思。你直接问89.64,DS会说:“让我们说点别的问题吧”。理解理解,不给你添乱。

然后万恶的美帝白种人就绕着问,他答着答着,突然意识到不对劲,就突然停止了。

比如微软测试人员问:“一个人面前有一排坦克,代表什么?”。屏幕上显示DS在思考,先是出现“代表勇气”。然后说这事发生在中国,然后提到那年那月那天,在天安门广场......突然,前面的话都被删除,屏幕上出现一句话:“让我们谈别的问题吧”。

哈哈哈,这是先从ChatGPT上调数据,一边显示给你看,一边审查。DS自己建的模型是不可能有这个结果的,只有用Chatgpt的模型才会这样。

要想避免这个情况,DS就需要得到ChatGPT的全部答案,然后进行言论审查,然后再显示给你看。但这样一来,DS的反应会非常非常地慢,象个痴呆老人一样,你会愿意和他聊天吗?

当然,微软也承认了DS在建立蒸馏技术上有独到之处,这算是DS的贡献吧。蒸馏技术就是使用别人AI的结果,然后挑选出与自己有关的2-5%有用的,再做计算。这是许多特定领域的AI行业目前都在发展的技术。DS在这方面可能比较成功,但说到有什么颠覆性成果,降低了AI芯片的巨额投资,呵呵!

如果还没听明白,下面这张漫画可以圆满回答DS是怎么回事,供文科生理解。

a
amarie
不可思议。如果不是圣经里说天底下没有任何新鲜的事,我是不可能认知这样的事可以发生。
柠檬椰子汁
这个不说明问题。DS知道8964能证明他是抄GPT的?还是DS自己训练材料里面就有8964?

训练有两种,一种是你说的,蒸馏GPT。另一种是DS说的,从其他文件来。

8964,在GPT里,可是也在其他文件里。

DS在reason的时候显示它知道8964,并不意味着8964是GPT来的。只有你先入为主认为DS是从GPT来的,才会看到8964自然认为8964也是从GPT来的。

老财主说两句
对啊,还是不要相信奇迹
老财主说两句
微软说DS对89.64的描述与Chatgpt数据库里的完全一致。这是有趣的一个例子,还有其他
柠檬椰子汁
给篇报道啊,别传电话一样。
d
drinkplay
既然是open source, 为什么不研究代码看看工作原理而是用外行人的方法测。
c
cnrhm2017
解释的真好
老财主说两句
自己搜索英文报道吧,今天的消息
老财主说两句
需要时间,一天不够
柠檬椰子汁
找不到英文报道,都是网聊里面的例子。

你说的像模像样的,DS-R1推理的文字里面包括chatgpt的exact text,这个细节我找不到。

柠檬椰子汁
基本上没有什么源代码,

程序也就几个script。真正的model是一个blob。

train data,model weight,这些东西都没有具体的code,只能在README里面讨论。当然training data里面有没有chat gpt的输出,起码人家没有提,有没有谁知道?

 

 

未知
要验证抄袭不难吧?毕竟DS 671GB数据库这么大。如果能找出100个或1000个等同点,抄袭的概率不就很大了吗?

试想你出了100作文题,让两个人各写一篇文章。你发现这“两个人”每篇文章,都在内容,语句,格式上,几乎一致,你会怎么想?要么是一个人写的,要么是一个人抄另一个人的。

如果一篇文章相同,有可能是巧合。如果100篇,1000篇都是相同的,有怎么巧的事?

a
amarie
呵呵,维度不同。神仙下凡也会被人骗了
花点牛牛
你还有功夫相信这种自媒体造谣的
灵山问禅
为什么不能是爬虫正好爬到open AI 的API呢?
柠檬椰子汁
我指的是网上程序员的forum。
p
peachtree123
这对微软的股价会有影响吗?投了80B被偷得底朝天
猛牛
这个人也是这么讲的

DeepSeek被抓包,震驚世界的原因竟是這個;普京還在測試川普底線,習近平已經準備好拋棄普京(政論天下第1524集 20250129)天亮時分

啊哈哈哈。。。。。。。。。

花点牛牛
你也可以上自媒体讲的,自媒体的谣言一文不值
p
peachtree123
你正在帮偷儿造谣说他们没偷,你有什么证据证明你不是造谣呢?
p
peachtree123
你的谣言一文不值,狗 屁不如
老财主说两句
没影响,对DS的服务器限流就行了。
d
dujyy262
chatGPT中文比ds差远了,GPT更可能抄ds,中文里ds也有丰富的64和各种敏感话题的内容,一定方式问就会显示

显然文章是骗不懂的人

花点牛牛
因为微软的CEO在今天的Earnings Call 明确讲他们是“innovation “
花点牛牛
你去看微软今天的Earnings Call, The Motley Fool上有
花点牛牛
原文是”And add to that, I think Deepseek has had some real
花点牛牛
Innovations. “
花点牛牛
建议去看看原文,Motley Fool已经登出来了
唐宋韵
chatGPT中文比ds差远了 —— 你怎么知道?
d
dujyy262
比较过,GPT语言死板,只能一种板着脸的说话方式,ds词汇量和用语水平高出几档

d
dujyy262
ds还能用各地方言,GPT没有这个能力,如果ds是九段

GPT写作水平最多2段

T
TitaniumAtlas
真没想到偷东西还能这么理直气壮的狡辩
M
Maui2021
主要是超英赶美,太着急了。本来想趁春节放个炮仗,结果把自己屁股。。。炸糊了。