据传要告DeepSeek抄袭,因为使用了OpenAI的API进行模型蒸馏。据我有限的AI的知识理解,蒸馏难道不是需要模型内部输出的信息,而不仅仅是最终的输出的output吗?但API仅仅提供最终输出结果啊,这个不是蒸馏吧,顶多是immitation learning。类似于我看到了一辆车,我觉得不错,我去制造了一辆类似的(前提是不违反外观专利等,LLM输出也没有专利。。。),这个不是抄袭吧;如果说我去车厂内部参观然后回来仿造,那说抄袭还稍微靠谱点。 maifangzi2017 发表于 2025-01-29 12:30
HelloWorld321 发表于 2025-01-29 12:34 老传统了,先抹黑,制造舆论,让不明真相的韭菜们信以为真,再慢慢地偷偷摸摸的辟谣,或不了了之,但破坏的目的已经达到。 之前气象气球就是,以至于现在来个不明飞行物,老百姓首先想到的是不是中国又放了什么东西飞过来。 以后中国有什么大模型有突破,人们第一印象不是恭喜,而是会指责又偷了什么东西才做的出来。
shushan 发表于 2025-01-29 12:36 没搜到说openai状告deepseek的链接,楼主能否给一下链接
lake123 发表于 2025-01-29 13:50 我到是看到很多说DS抄袭OpenAI的酸文及host来自弯弯和自恨党媒体
minqidev 发表于 2025-01-29 13:20 这就是原因。昨天砸下去几百亿美元,nvda股价都上不去
看来英伟达承受压力 wun 发表于 2025-01-29 14:23
你说的没错👍
没搜到说openai状告deepseek的链接,楼主能否给一下链接
对的, 蒸馏需要先知道基础大模型的weight,
但这点OpenAI本来就从没公开过,所以谈不上蒸馏
微软抄Apple Meta,YouTube抄 tiktock 太多了
问题是deepseek比chatgpt多块好省啊,又开源,伤害最大的就是它自己了。价值跌了90%以上。
说起不明物就知道这些傻逼得逞了。前些日子nj那些,那猜测不是中国间谍气球,就是伊朗无人机的,还有说外星人的,我看了半天地图,觉得伊朗无人机飞来nj这航程技术要逆天,结果呢,这两天公布了,都是美国自己批准的飞行活动
你的模型和他们不是一个东西
我到是看到很多说DS抄袭OpenAI的酸文及host来自弯弯和自恨党媒体
它们有这认知水平,是好事。
这昨天反弹的点儿,快全没了吗
看来英伟达承受压力
黑客攻击, 国家安全, 抄袭, 资本介入
全使上了。现在美联储为这个在紧急开会,估计会全美范围封禁Deepseek.