据传Breaking Openai要起诉DeepSeek抄袭

小

小青龙

7 个月

回复 11楼 junjunzi 的帖子
我以为他是开玩笑copy cat，所以catgpt

mise88

7 个月

昨

昨夜小樓聽雨

7 个月

估計是擋人財路了吧。你想一下：微軟投了幾百億搞了openAI。如果按現在估值上市的話能收割好多錢吧。
可是DS來了，刺破了一大批人的財富夢，連老黃的輝達都虧麻了。
所以，儘管DS開源對人類社會有貢獻，但對資本家可沒有半點同情。估計被他們恨死了吧。所以才會被攻擊，被起訴，被輿論轟炸。
另外，如果DS的老闆在美國，小命堪憂。就像去年那個揭露openAI侵權抄襲的那個印度工程師那樣被自殺在家中。
歡迎來到美國這個資本的世界。

youdai

7 个月

楼主是在胡扯

MegMegMeg

7 个月

Distillation的意思就是比如GPT是老师，花了很多时间学习1+1=？，很多试错明白原来1+1=2。现在deepseek是学生，也要学习1+1=？，所以到底等于几？deepseek的开发人员就问gpt，gpt说是2，那么deepseek就把2作为标准答案来反复练习。至于deepseek怎么学怎么锤，这是他自己的事，其实deepseek已经开源的代码表明他用的算法，所谓reinforcement learning，就是自己循环跑一点一点提高，是不需要标准答案的，所以才锤得快，早期可能用了一点标准答案来打底initialize——所以到底能不能用其他模型的输出来当标准答案锤自己，啥也不懂的红脖政客当然说不能啦。
从伦理道德上讲，AI其实就是模仿人类思维，学生从老师那里问了一份标准答案来学习知识，行不行？确切的说并不是1+1那么简单，而是学生从老师那里看了一篇议论文怎么写，格式段落等等，然后自己找资料，自己组织语言，自己反反复复修改（RL），这行不行？这算学生抄袭老师？那么老师学习的时候又是从哪儿找的标准答案，老师算是抄吗？——老师确实是抄了，gpt被很多作者包括NYT起诉版权问题，所以核心就是AI数据不可避免的要跨行业互相用，现在这方面regulation很少，大家随意杠，不必当真。

yanhren

7 个月

昨夜小樓聽雨发表于 2025-01-29 12:11
估計是擋人財路了吧。你想一下：微軟投了幾百億搞了openAI。如果按現在估值上市的話能收割好多錢吧。
可是DS來了，刺破了一大批人的財富夢，連老黃的輝達都虧麻了。
所以，儘管DS開源對人類社會有貢獻，但對資本家可沒有半點同情。估計被他們恨死了吧。所以才會被攻擊，被起訴，被輿論轟炸。
另外，如果DS的老闆在美國，小命堪憂。就像去年那個揭露openAI侵權抄襲的那個印度工程師那樣被自殺在家中。
歡迎來到美國這個資本的世界。

你可以写小说啦！

youdai

7 个月

Congrats to DeepSeek on producing an o1-level reasoning model! Their research paper demonstrates that they’ve independently found some of the core ideas that we did on our way to o1. — Mark Chen (@markchen90) January 28, 2025

系统提示：若遇到视频无法播放请点击下方链接
https://x.com/markchen90/status/1884303237186216272
https://x.com/markchen90/status/1884303237186216272 OpenAI Chief Research Officer的表态，意思是DeepSeek的论文表明他们独立摸索出了和O1类似的模型，但是别急，OpenAI正在憋大招

ofwlily

7 个月

maoxiandao 发表于 2025-01-29 11:32
回复 175楼 kreaty 的帖子
开源只是开的代码，代码无非就是优化，设置参数。关键是训练。训练好了的一个网络就不一样了。

你以为的训练是什么样子的呢？你要知道你面对的不是一个小孩，一个宠物，是一台装有程序的机器。训练用的就是各式代码组合啊。

COHomeSearch

7 个月

转移注意力，估计花大价钱请了PR团队和律师。

yanhren

7 个月

yanhren

7 个月

youdai 发表于 2025-01-29 12:16

Congrats to DeepSeek on producing an o1-level reasoning model! Their research paper demonstrates that they’ve independently found some of the core ideas that we did on our way to o1. — Mark Chen (@markchen90) January 28, 2025

系统提示：若遇到视频无法播放请点击下方链接
https://x.com/markchen90/status/1884303237186216272
https://x.com/markchen90/status/1884303237186216272 OpenAI Chief Research Officer的表态，意思是DeepSeek的论文表明他们独立摸索出了和O1类似的模型，但是别急，OpenAI正在憋大招

别着急，同一twitter下的其他内容也读一读嘛

ofwlily

7 个月

yanhren 发表于 2025-01-29 12:24
别着急，同一twitter下的其他内容也读一读嘛

只要有一丝能告赢的机会，资本家是绝对不会放弃的，更何况前期还投入了那么多成本。等openai告，大家吃瓜。

skyfi

7 个月

open AI向来戏多

thymesu

7 个月

西北飘雪发表于 2025-01-29 08:45
有颠覆的算法，OpenAI公布吗？这是别人的成果，你要求用在全人类？而且人家是开源啊，不收费，还要咋的？你脸那么大，让医药公司公布它们药物发现的管线试试看？你漏一个字腿试试？你让OPenAI公布一下它怎么没有经过许可搜集资料的？那个吹哨子人都被灭了发现OpenAI在中文里是O喷AI，哈哈

有一说一，不是完全免费。Call 他们的API 是收费的，按token收，只不过很便宜。

sugeeamimi15

7 个月

所以说zuckerberg一直在强调美国要在AI立法上面先发制人，要做规则制定者

maifangzi2017

7 个月

回复 1楼 baxiangxiang 的帖子
OpenAI Meta之类的为什么自己不去蒸馏？如果蒸馏这么简单好用的话，没道理这些公司自己开发了模型不去蒸馏啊。

Sparky08

7 个月

回复 206楼 yanhren 的帖子
嗯，表示低花费搞好用的软件AI是可以的，不是所谓要堆硬件显卡算力，钱不够卡不够就不行，这不就是DS出现的一个结果吗。你读了半天，你的反华脑子读出啥了？

schrodingerh

7 个月

AI们就不要分先来后到了，本是同共生，相煎何太急

schrodingerh

7 个月

sugeeamimi15 发表于 2025-01-29 12:50
所以说zuckerberg一直在强调美国要在AI立法上面先发制人，要做规则制定者

美国尽管立法好了，中国需要听吗？

qodzsdf

7 个月

mjtalk

7 个月

maoxiandao 发表于 2025-01-29 10:57
回复 161楼 maoxiandao 的帖子
科研界都是如此。都很反感国内这种。他们自己不想点子，每天盯着美国实验室的网站，别人做了啥，他们就去一样的做啥，填补国内空白，国内可以拿到钱，而且人力便宜，你招一个学生的钱，国内可以招10 个，你想的新idea，还没来得及做，他们就拿到钱，放10 个人做，怎么做的过他们？这种恶意的竞争一旦普及到全世界，真的不是什么好事。

你说的根本没道理，按照你的说法，难道只要有一个公司有idea，就可以垄断，别人都不能做，实际上美国公司一样有同类产品竞争，打车有Uber，Lyft，网上支付Zelle，PayPal，Venmo，点餐配送doordash，grabhub, seamless等等，按照你的说法都是相互抄袭

小

小乖媽咪

7 个月

baxiangxiang 发表于 2025-01-29 05:21
Openai要起诉DeepSeek抄袭蒸馏技术就是直接用现成的openAI预训练数据进行提纯，算力成本当然非常低。你问deepseek你是谁？deepseek会说“我是catgpt”

妒忌令人面目全非吧
来自 OpenAI 的研究主管 Mark Chen 已经大方地承认：「DeepSeek 的研究论文表明，他们独立地发现了 OpenAI 在实现 o1 过程中的核心思想」。

西

西北飘雪

7 个月

美国的火箭导弹技术哪来的？美国重新发明了英国的蒸汽机？
yaob2002 发表于 2025-01-29 11:41

算了，本来要再杠，但不熟悉的领域我闭嘴

西

西北飘雪

7 个月

小乖媽咪发表于 2025-01-29 13:05
妒忌令人面目全非吧
来自 OpenAI 的研究主管 Mark Chen 已经大方地承认：「DeepSeek 的研究论文表明，他们独立地发现了 OpenAI 在实现 o1 过程中的核心思想」。

我为Mark Chen人身安全担心。

minqidev

7 个月

回复 217楼的帖子
他后面有质疑，大意思是，Deepseek的员工可能违反 chat gpt 的使用条例。
因为里面有一条：不能使用chat gpt 去训练其他模型，处罚方式吗，其实就是chat gpt可以以此停止你的账号。
反正是挺搞笑的。但是又不开源，意义不大，顶多作为一个打标签的自动化工具

wfys

7 个月

mtwash 发表于 2025-01-29 06:37
首先，OpenAI吹哨人是为什么死的？揭发OpenAI侵犯版权，使用未授权资料。未授权的资料使用的最大罪犯是OpenAI，而不是世界上任何一个其它公司。
其次，Google的Gemini因为用了百度的资料训练，也曾自称自己是文心一言。类似的例子还不少，比如台湾的中央研究院的AI实验室的chat bot，也曾自称自己是上海人工智能实验室的作品。OpenAI先说清楚它自己的资料是从哪里来的，再来声索它的版权吧。

你这个根本不是Google Gemini。

披

披香侍女

7 个月

如果起诉的话OpenAI是不是就得说明自己的数据来源了？

schrodingerh

7 个月

西北飘雪发表于 2025-01-29 13:09
我为Mark Chen人身安全担心。

把自己的chief research officer给灭口了，再蠢也不能够吧？

schrodingerh

7 个月

qodzsdf 发表于 2025-01-29 13:03

小扎视角独特，吹一波自己的开源模型

kittyspecial

7 个月

风起洛阳发表于 2025-01-29 06:07
这下deepseek更火了！其实挺为国内这些年的发展变化骄傲的。从TikTok到小红书到deepseek，公司同事对中国的讨论就没断。
再回头看看天天刷手机打游戏的娃我心想你拿啥跟国内卷出来的孩子拼啊

其他同意不过国内娃手机也刷的厉害抑郁症也多的吓人现如今哪的娃都不好带

yanhren

7 个月

Sparky08 发表于 2025-01-29 12:57
回复 206楼 yanhren 的帖子
嗯，表示低花费搞好用的软件AI是可以的，不是所谓要堆硬件显卡算力，钱不够卡不够就不行，这不就是DS出现的一个结果吗。你读了半天，你的反华脑子读出啥了？

简单理解一下那些twitter的意思有那么难吗？不政治挂帅就不会说话了吗？
实在不行你用chatgpt翻译一下，理解一下他依然乐观以及坚持自己roadmap的原因吧！被政治沙子迷了眼，啥也看不到了吗？

elleanor

7 个月

maoxiandao 发表于 2025-01-29 11:39
回复 179楼 dodgers 的帖子
你去科研界看看，你单纯把一个液压换成电机看能不能在美国拿到钱做一个项目来？评审人就把你毙了

这里不止你一个人在美国申过funding

desultory

7 个月

最近不知道是不是有些舆论在带节奏. 不可否认DS很成功，但是，也请大家一定要承认他的成功是建立在美国几大AI巨人的肩膀上成功的. 无论蒸馏算不算抄袭，DS在节流这个赛道上真的走出了自己的一片天地. 但以后的AI还是要看谁能走出下的一步，真的是让子弹再飞一会儿吧.
还有就是很多人总在比较DS和chatgpt 谁更牛，最常见的是问一个极其简单的问题然后ChatGPT在胡说. 这其实不是一个大问题，因为AI的学习方法和人类不同，人类是从简单开始，先学加减法才能学高数，但AI是可以先学数学竞赛的题再回来学加减法，所以大家别着急. AI不是笨也不是胡诌，给他点时间.
最后就是gpu, 只要AI在，他一定有市场，train Ai和运用都离不开. 个人愚见，Nvidia还是会涨回来的，可以酌情入一些.

minqidev

7 个月

回复 226楼 yanhren 的帖子
对，其实OpenAI 的恰恰说明了Deepseek没抄袭。因为在他们看来，过于低耗，会降低性能，至少他这么认为。两个还是有差别的，各自都有各自的情况

mjtalk

7 个月

desultory 发表于 2025-01-29 13:31
最近不知道是不是有些舆论在带节奏. 不可否认DS很成功，但是，也请大家一定要承认他的成功是建立在美国几大AI巨人的肩膀上成功的. 无论蒸馏算不算抄袭，DS在节流这个赛道上真的走出了自己的一片天地. 但以后的AI还是要看谁能走出下的一步，真的是让子弹再飞一会儿吧.
还有就是很多人总在比较DS和chatgpt 谁更牛，最常见的是问一个极其简单的问题然后ChatGPT在胡说. 这其实不是一个大问题，因为AI的学习方法和人类不同，人类是从简单开始，先学加减法才能学高数，但AI是可以先学数学竞赛的题再回来学加减法，所以大家别着急. AI不是笨也不是胡诌，给他点时间.
最后就是gpu, 只要AI在，他一定有市场，train Ai和运用都离不开. 个人愚见，Nvidia还是会涨回来的，可以酌情入一些.

DeepSeek自己都说了是建立在开源也就是其他人collective knowledge的基础上，而且他们自己也继续免费开源，OpenAI和其他公司如果有两把刷子完全可以在他们新突破上更加进步。那些AI公司和业内人士都表示欢迎这种突破，可能只有Alex Wang这种心理扭曲的人才到处咬

mjtalk

7 个月

看到别人的一个转发，这位是英伟达的Senior Research Scientist，也是华人，说DeepSeek一个founder曾经在英伟达当过intern，拒绝了FT offer，回国加入DeepSeek创业去了。他也挺敢说的，最后一句话正中靶心。

goodluckall

7 个月

回复 231楼 mjtalk 的帖子
为这个国人点赞

yanhren

7 个月

minqidev 发表于 2025-01-29 13:34
回复 226楼 yanhren 的帖子
对，其实OpenAI 的恰恰说明了Deepseek没抄袭。因为在他们看来，过于低耗，会降低性能，至少他这么认为。两个还是有差别的，各自都有各自的情况

技术问题，不懂。
但是Mark Chen的twitter显示不是这个意思。
当然，站在别人的肩膀上能率先找到distillation的方法，也足够厉害了！对于成本Mark Chen显然也是质疑，认为外界的反应夸大了。至于预先训练还是推理的两种方式，不懂是不是意思是Chatgpt是预先训练；而deepseek是推理？反正是可以降低成本的。
However, I think the external response has been somewhat overblown, especially in narratives around cost. One implication of having two paradigms (pre-training and reasoning) is that we can optimize for a capability over two axes instead of one, which leads to lower costs.

yanhren

7 个月

mjtalk 发表于 2025-01-29 13:45
DeepSeek自己都说了是建立在开源也就是其他人collective knowledge的基础上，而且他们自己也继续免费开源，OpenAI和其他公司如果有两把刷子完全可以在他们新突破上更加进步。那些AI公司和业内人士都表示欢迎这种突破，可能只有Alex Wang这种心理扭曲的人才到处咬

Twitter上有新加披的芯片进口突然大增的很多文章，不知道为什么？

desultory

7 个月

yanhren

7 个月

skyfi

7 个月

yanhren 发表于 2025-01-29 13:57
Twitter上有新加披的芯片进口突然大增的很多文章，不知道为什么？

之前有报道有人倒卖GPU通过新加坡到中国

maoxiandao

7 个月

回复 203楼 ofwlily 的帖子
训练的就是一个网络各个节点的参数，权重。代码告诉怎么训练，怎么才叫最优解。有各种算法，代码。训练的不是代码，是一个神经网络。

desultory

7 个月

是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. hello

minqidev

7 个月

yanhren 发表于 2025-01-29 13:55
技术问题，不懂。
但是Mark Chen的twitter显示不是这个意思。
当然，站在别人的肩膀上能率先找到distillation的方法，也足够厉害了！对于成本Mark Chen显然也是质疑，认为外界的反应夸大了。至于预先训练还是推理的两种方式，不懂是不是意思是Chatgpt是预先训练；而deepseek是推理？反正是可以降低成本的。
However, I think the external response has been somewhat overblown, especially in narratives around cost. One implication of having two paradigms (pre-training and reasoning) is that we can optimize for a capability over two axes instead of one, which leads to lower costs.

两拨人，大概都到了一个路口，一方因为有足够的硬件，选择了更慢更好能，可能结果更好的一个方向；一方因为没有足够的硬件，选择了如何提高速度。
但是，他们大体方向应该差不多了。只是在走向最终结果的，选择了利于自己的方式。

desultory

7 个月

DeepSeek自己都说了是建立在开源也就是其他人collective knowledge的基础上，而且他们自己也继续免费开源，OpenAI和其他公司如果有两把刷子完全可以在他们新突破上更加进步。那些AI公司和业内人士都表示欢迎这种突破，可能只有Alex Wang这种心理扭曲的人才到处咬
mjtalk 发表于 2025-01-29 13:45

mjtalk

7 个月

desultory 发表于 2025-01-29 14:00
hi

从哪里看到DeepSeek没有尊重美国科学家了，你应该去看看OpenAI前一段时间的drama，那些跟Sam Altman决裂的科学家，说明他们内部有很大的分歧，自己发展不好不能埋怨别人

skyfi

7 个月

desultory 发表于 2025-01-29 14:04
是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. hello

我觉得梁文峰除夕的文章说的挺实诚的他们一直没有否认是站在巨人肩膀上。我觉得这个很拉好感，比什么“遥遥领先，稳了”大气多了。

minqidev

7 个月

是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. sorry 不太会用回复了好几遍
desultory 发表于 2025-01-29 14:06

DS成功之前，所有人都认为中国出不了openAI这样的东西。没硬件，没人踩，没政策，啥都没有。
阿里巴巴也有自己的大模型，但他们做出来的东西，却和DS不同，他们的是基于meta的。但是DS确实真正自己训练出来的，所有东西都是新的。
中国厉害的大模型还很多，还有豆包，kimi，但是Deepseek却是与众不同的，因为根据他的方法，小公司也可以实现和部署，这才是最伟大的意义。

layjohns

7 个月

desultory 发表于 2025-01-29 14:06
是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. sorry 不太会用回复了好几遍

不尊重科学家的是openAI自己，刚出名就开始内斗，斗得那叫一个丑陋，最后啥人滚蛋啥人留下不很明显嘛

yanhren

7 个月

新加坡的AI啥发展水平？芯片需求量激增。

minqidev

7 个月

新加坡的AI啥发展水平？芯片需求量激增。

yanhren 发表于 2025-01-29 14:15

台湾难道不就是和新加坡一个水平吗？总共也就10000多块，都不够腾讯和阿里巴巴，百度分呢。想什么呢。想着新加坡把所有的都给Deepseek，然后他成功呢？

aflier

7 个月

desultory 发表于 2025-01-29 14:06
是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. sorry 不太会用回复了好几遍

怎样尊重？就是说不要开发deepseek 吗？还是说任何人做研究都不能站在前人肩膀上，都需要从1+1开始研究起？
光写个reference 不够吗？

yanhren

7 个月

minqidev 发表于 2025-01-29 14:22
台湾难道不就是和新加坡一个水平吗？总共也就10000多块，都不够腾讯和阿里巴巴，百度分呢。想什么呢。想着新加坡把所有的都给Deepseek，然后他成功呢？

你咋知道10000多块的？咋计算出来的？
我看到的只有金额，没有数量。

yanhren

7 个月

minqidev 发表于 2025-01-29 14:22
台湾难道不就是和新加坡一个水平吗？总共也就10000多块，都不够腾讯和阿里巴巴，百度分呢。想什么呢。想着新加坡把所有的都给Deepseek，然后他成功呢？

台湾有台积电，大家都知道。新加披有啥呢？

xiaoqiu123

7 个月

desultory 发表于 2025-01-29 14:06
是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. sorry 不太会用回复了好几遍

蒸馏不是晚道超车是截胡。这下又可能会影响到以后ai发展，至少openai是不会再开放数据免费下载了。连以后代码开源都有可能受影响

pangapang

7 个月

20 多页了也没出现什么证据就是蒸馏chatgpt 而来路径依赖严重，都相信大力出奇迹，语料多就是好，算力强就能能更好语料组织方法很多的，可人工裁剪可合成可买可蒸馏，海量也不等于就是好 ds 团队把算力极致优化了, 细粒度的优化都是PTX做的，寄存器分配thread级别的调整，工作量很大日后也很难维护，智力体力双结合，真是国人才会干出这种工程

layjohns

7 个月

yanhren 发表于 2025-01-29 14:25
你咋知道10000多块的？咋计算出来的？
我看到的只有金额，没有数量。

H100的价格是知道的，算算就是了，不能精确有个约数还是没问题的

layjohns

7 个月

xiaoqiu123 发表于 2025-01-29 14:28
蒸馏不是晚道超车是截胡。这下又可能会影响到以后ai发展，至少openai是不会再开放数据免费下载了。连以后代码开源都有可能受影响

openai开放啥免费数据下载了？

danhuang7

7 个月

whitein 发表于 2025-01-29 14:31
傻X！毛都不懂，就来给洋大人抬轿子了

真的，这些人连蒸馏到底是啥意思都没搞懂，就上蹿下跳的，非常搞笑。但凡是现在正在参与开发大模型的工程师都说不出这种话来，说这些话的都是那些似懂非懂和已经过时的老古董们

minqidev

7 个月

台湾有台积电，大家都知道。新加披有啥呢？
yanhren 发表于 2025-01-29 14:27

台积电用H100吗，几万吗，你想多了把。

xiaoqiu123

7 个月

open ai 有个数据接口给用户download数据非商业用途， DS用这个大量download openai数据build自己数据库。简单说就是超了人家的题库和答案

wun

7 个月

是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. sorry 不太会用回复了好几遍
desultory 发表于 2025-01-29 14:06

就是有个问题，从0到1很花钱，不管是设备还是人才，但现在没有相关的法律，之后很多公司站在巨人的肩膀上，这样下去那些伟大的公司怎么赚钱？

goodluckall

7 个月

回复 260楼 xiaoqiu123 的帖子
就算真的ds用了closeAI的数据，那ds也确实没用做商业用途啊

minqidev

7 个月

你咋知道10000多块的？咋计算出来的？
我看到的只有金额，没有数量。
yanhren 发表于 2025-01-29 14:25

2024财年第三季度（2023年8月至10月），新加坡为英伟达贡献了约27亿美元的收入，占总收入的15% 估算把，如果27亿美元，高端大概10%是把，越1万张。全年4万张。多出来的可能是2-3万张，其中H100大约1万。

魏

魏大爷的邻居

7 个月

公关策略，

minqidev

7 个月

回复 260楼 xiaoqiu123 的帖子
就算真的ds用了closeAI的数据，那ds也确实没用做商业用途啊
goodluckall 发表于 2025-01-29 14:40

因为他开源了。他只是学习目的。感觉你说的最对。

xiaojiejie

7 个月

desultory 发表于 2025-01-29 14:04
是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. hello

DS 没说蒸馏Chatgpt的数据吧。你这就给定罪了

yanhren

7 个月

回复 255楼 layjohns 的帖子
没说都是H100呀？没说卖得是啥型号呀？这都能算出来，神人，佩服！

yanhren

7 个月

回复 259楼 minqidev 的帖子
哪里说H100啦？不过是个销售额的汇总表，还能看出芯片型号，开天眼啦？

yanhren

7 个月

回复 263楼 minqidev 的帖子
真够粗糙的！啥都没有，就直接推演啦！新加坡干啥用的，啥公司用的，都不知道，就能开始计算啦！你作业肯定不提问，少啥条件咱不会自己补充呀！真实情况啥样，不重要，咱的推演最合理！

minqidev

7 个月

yanhren 发表于 2025-01-29 14:47
回复 259楼 minqidev 的帖子
哪里说H100啦？不过是个销售额的汇总表，还能看出芯片型号，开天眼啦？

其他型号忽略不计。。。。。其他型号就是一些4060，4090，去年主要用来打黑神话悟空的。

yanhren

7 个月

回复 270楼 minqidev 的帖子
不懂芯片的型号，也不知道单价。单纯对你这种没条件，假设条件，然后用无比肯定的语气证明自己是对的勇气表示。。。

majiaking

7 个月

从X转发来的（具体内容不负任何责任）：你以为DeepSeek的AI奇迹，只靠神秘算法？大错特错！真正令他们领先的秘诀，恰恰是连CEO梁文峰都亲自下场干的“脏活” —— 数据标注！与那些轻率的 “AI玄学” 论调截然相反，DeepSeek R1的突破，根植于海量的优质人工生成和合成数据。事实上，DeepSeek模型在开源领域，正以惊人的数据量刷新纪录： 1️⃣60万条核心推理数据 (驱动模型深度思考) 2️⃣20万条监督微调 (SFT) 数据 (提升模型指令跟随能力) 3️⃣规模惊人的RLHF人工偏好数据集 (据估计至少300-500万条样本！远超同行，塑造更符合人类价值观的AI) 4️⃣关键的CoT链式推理合成数据 (高质量“冷启动”燃料，加速模型效率飞升) 正是这史无前例的高质量数据投喂，才最终成就了DeepSeek R1在低成本下，推理能力的惊人涌现，开创AI新范式！如此规模的优质合成数据，究竟从何而来？答案或许已呼之欲出。

COHomeSearch

7 个月

我们公司网络把deepseek禁了，昨天还能用的

xiaoqiu123

7 个月

回复 262楼 goodluckall 的帖子
ds 是一个商业公司这就是不折不扣的商业用途并不是卖钱才是商业用途。 tt google 都不是付费使用但是他们都是不折不扣的商业公司有了流量就有了钱

welkin25

7 个月

现在huggingface不是说要立项复刻ds的训练过程吗 https://huggingface.co/blog/open-r1 可以等等看他们最后喂什么样的数据才能达到R1的成绩

zhuizhenxiang

7 个月

感觉是个爆竹一样吓人一跳。

Silverwing

7 个月

desultory 发表于 2025-01-29 14:04
是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. hello

0-1 尊重我同样尊重1-2 或者2-3
而不是某些人拼命踩23，无限抬高1 的作用
科学工程领域，每一个新突破都建立在前人基础上，这是科学发展的必然，没有任何一个国家或团体有权利禁止别人进步

yottacom

7 个月

我问了一下deepseek, 回答是：您好！我是由中国的深度求索（DeepSeek）公司开发的智能助手DeepSeek-V3。如您有任何任何问题，我会尽我所能为您提供帮助。

sea9

7 个月

Silverwing 发表于 2025-01-29 15:36
0-1 尊重我同样尊重1-2 或者2-3
而不是某些人拼命踩23，无限抬高1 的作用
科学工程领域，每一个新突破都建立在前人基础上，这是科学发展的必然，没有任何一个国家或团体有权利禁止别人进步

同意，还有什么算是0-1？比如AI和LLM，GenAI, 是AI出现是算0-1，还是LLM/GEN-AI算0-1？估计AI出来的时候，版上的姐妹们大部分都还没出生吧。

welkin25

7 个月

Silverwing 发表于 2025-01-29 15:36
0-1 尊重我同样尊重1-2 或者2-3
而不是某些人拼命踩23，无限抬高1 的作用
科学工程领域，每一个新突破都建立在前人基础上，这是科学发展的必然，没有任何一个国家或团体有权利禁止别人进步

这几天不是踩0-1的最多吗，都在阴阳怪气美国这些大公司被一群小孩的“side project”打败了

OLOAHA

7 个月

desultory 发表于 2025-01-29 14:06
是你说的都对. 但你说的太轻松了，忽略了这种0-1的突破往往是最难的，最耗钱和人力的，包括顶住外界的否定和压力. 现在DS通过蒸馏弯道追上，反而很轻松的说我们建立在开源，也一直在开源，你有两把刷子你再继续更近继续突破啊. 其实开源也是一把双刃剑，在有利百姓的时候，也一定会有人拿他作恶，比如电骗会不会大肆利用DS的开源呢. 我一直没有否定DS，但也请大家尊重美国这些科学家们的努力. sorry 不太会用回复了好几遍

从0到1往往是最难的，比如牛顿定律，麦克斯韦方程组，相对论……

goodluckall

7 个月

回复 274楼 xiaoqiu123 的帖子
这个说法我还是第一次听到

msilence

7 个月

COHomeSearch 发表于 2025-01-29 15:09
我们公司网络把deepseek禁了，昨天还能用的

很多公司IT今天都发布告警，禁用DS，担心数据安全

shushan

7 个月

msilence 发表于 2025-01-29 16:31
很多公司IT今天都发布告警，禁用DS，担心数据安全

chatgpt可以不？我们公司暂时两个都还行

OLOAHA

7 个月

shushan 发表于 2025-01-29 16:39
chatgpt可以不？我们公司暂时两个都还行

即使是chatgpt，也不能往问题里放涉及公司机密的东西，除非是公司用chatgpt api定制的版本

shushan

7 个月

即使是chatgpt，也不能往问题里放涉及公司机密的东西，除非是公司用chatgpt api定制的版本
OLOAHA 发表于 2025-01-29 16:42

可以自己架设一个，deepseek是开源的，youtube里好多都在自己弄，很方便的说现在，可以彻底隔绝上网避免安全问题，而且deepseek很贴心的蒸馏了不同大小的model，很挫的只有cpu机器都能跑，只是性能有差异

msilence

7 个月

shushan 发表于 2025-01-29 16:39
chatgpt可以不？我们公司暂时两个都还行

理论上都不行，但对ChatGPT反应强度明显跟DS不一样

OLOAHA

7 个月

shushan 发表于 2025-01-29 16:45

可以自己架设一个，deepseek是开源的，youtube里好多都在自己弄，很方便的说现在，可以彻底隔绝上网避免安全问题，而且deepseek很贴心的蒸馏了不同大小的model，很挫的只有cpu机器都能跑，只是性能有差异

model是已经训练好的下载就能用，不用自己训练了？

nospoon

7 个月

贡献一个直接在browser里run deepseek-r1的link吧 https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

schrodingerh

7 个月

OLOAHA 发表于 2025-01-29 16:16
从0到1往往是最难的，比如牛顿定律，麦克斯韦方程组，相对论……

AI肯定不是从0到1，几十年前研究就开始了

schrodingerh

7 个月

把deepseek都禁了好，别来占用资源我总是用了两分钟就服务器繁忙了

teabucket

7 个月

OpenAI训练的数据哪来的，还不是网上的，它用数据包括你我的数据，给我们钱了吗？到头来还不是想从我们这里收每人每月$200？人家deepseek 把模型和数据直接返还给全人类，这是什么高度。而且白宫发言炒作这个事情无非是强化中国人不偷不能做事这个刻板印象。其实说穿了，这个属于蒙骗门外汉的宣传伎俩。因为deepseek 这次突破在于出了一个更好的模型，而不是模型上的知识。至于这个模型从google搜索结果学会了微积分，还是从openAI 的输出结果学会了罗马历史，这根本不重要，重要的是如何构架这个更小更好的AI 模型

西

西北飘雪

7 个月