DeepSeek“蒸馏”剽窃OpenAI?专家:很难制止

今日头条
Toutiao
最新回复:2025年1月30日 19点10分 PT
  返回列表
43332 阅读
114 评论
德国之声/RFA

DeepSeek最新AI模型“价廉物美”,引发科技界震荡。但OpenAI本周三称,有证据表明DeepSeek使用OpenAI专有模型来训练自己的模型,并暗示这可能违反了OpenAI服务条款。美商务部长提名人卢特尼克指责DeepSeek似乎盗用了美国的人工智能技术。新闻可靠性评级机构NewsGuard 称,Deepseek-V3识别假新闻只有17%的准确率。

中国AI大模型初创公司DeepSeek(深度求索)1月20日免费开源的一款 DeepSeek-R1推理模型震惊了科技界和政界。该公司称这款新的AI模型性能足以媲美美国顶尖产品,但投资成本却低得多——仅557.6万美元,是OpenAI GPT-4o模型训练成本的不到十分之一。该公司还称,它使用是芯片是英伟达相对低端的芯片及其他低端进口芯片。

DeepSeek的这款AI聊天应用迅速登顶苹果中国和美国应用商店免费APP下载排行榜,同时引发市场对美国在AI领域竞争力的担忧、对美国企业投入天量资金研发AI合理性及这些公司发展前景的质疑,以及对美国对中国的芯片出口管制究竟有没有效的质疑,令美国科技公司股价大幅下挫。美国总统特朗普形容DeepSeek为美国业界“敲响警钟”,并提醒美国要“全力专注于在竞争之中取胜”。

对DeepSeek成本与芯片的质疑

不过,在一些媒体和专家把DeepSeek的“横空出世”称为AI界的“史普尼克时刻”之际,也有声音质疑DeepSeek所公布的开发成本以及所用芯片的规格与数量。

上周,美国人工智能数据服务公司Scale AI首席执行官汪滔 (Alexandr Wang) 在接受 CNBC 采访时对 DeepSeek的说法表示怀疑,称“这款产品的背后,可能使用了数万颗Nvidia(英伟达)的H100芯片”。他说,“DeepSeek显然拥有50,000颗H100芯片,但他们显然不能公开这些信息,因为那会违反美国的出口管制。”汪滔没有为他的说法提供证据。

亿万富翁埃隆·马斯克支持对DeepSeek持怀疑态度的人。他在X上有关亚历山大·王上述说法的帖子下跟帖写道:“显然”(Obviously)。

英伟达(Nvidia)的H100芯片是目前市场上最先进的AI训练芯片之一,但根据美国政府的出口管制政策,H100芯片是不能向中国公司销售的。

DeepSeek蒸馏提炼违反OpenAI条款?

DeepSeek也被一些技术专家怀疑其模型可能从美国先进的模型中学习到了部分成果,即采用了所谓的“蒸馏技术”。该技术是指通过从更成熟、更强大的人工智能模型中提炼数据来训练新的AI模型,由旧模型评估新模型得出的答案的质量,从而有效地转移旧模型所掌握的学习成果。这意味着新模型可以从旧模型中获益,而无需承担构建旧模型所投入的大量时间、算力等成本。

1月29日,OpenAI称,发现有证据表明DeepSeek使用OpenAI的专有模型来训练自己的模型,并暗示这可能违反了OpenAI的服务条款。不过,OpenAI没有进一步列举掌握了哪些证据。OpenAI的服务条款规定,用户可以使用OpenAI的API输出接口将其AI技术与自己的应用程序相结合,但禁止用户“复制”其任何服务或“使用其输出来开发与OpenAI竞争的模型”。用蒸馏输出构建竞争模型涉嫌违反 OpenAI服务条款。OpenAI表示,它将与美国政府合作保护美国技术,但没有详细说明如何合作。

美国商务部长提名人誓言要实施限制

特朗普总统提名的商务部长霍华德·卢特尼克 (Howard Lutnick) 1月29日在在参议院的确认听证会上表示,DeepSeek似乎盗用了美国的人工智能技术,并誓言要加强限制。他说,““我认为他们(中国)只关心自己,并试图伤害我们。因此,我们需要保护自己。”卢特尼克还表示:”我们必须停止帮助他们(中国公司)。Meta的开放平台让DeepSeek可以依靠。他们购买了大量英伟达的芯片,并找到了绕过(美国相关限制)的方法,推动了他们的DeepSeek模式。这一切必须结束。如果他们要与我们竞争,那就让他们竞争,但不要再利用我们的工具与我们竞争了。”

白宫的人工智能和加密沙皇大卫·萨克斯 (David Sacks) 也在周二接受福克斯新闻采访时对 DeepSeek的模型蒸馏表示担忧。

专家:阻止“蒸馏”非常困难

技术专家表示,阻止模型蒸馏可能非常困难,甚至不可能。

人工智能计算公司Groq的首席执行官乔纳森·罗斯 (Jonathan Ross) 表示,该公司已采取措施阻止所有中国IP地址访问其云端存储,以阻止中国公司利用其托管存储的人工智能模型。但是,“这是不够的,因为人们可以找到绕过它的方法”,罗斯说。“这将是一场猫捉老鼠的游戏……我不知道解决方案是什么。如果有人想出办法,请告诉我们,我们会实施。”

DeepSeek将会给世界带来哪些改变?图像来源: China DeepSeek AIThe smartphone apps DeepSeek page is seen on a smartphone screen in Beijing, Tuesday, Jan. 28, 2025. (AP Photo/Andy Wong)Mediennummer504473561BeschreibungThe smartphone apps DeepSeek page is seen on a smartphone screen in Beijing, Tuesday, Jan. 28, 2025. (AP Photo/Andy Wong)Aufnahmedatum28.01.2025Bildnachweispicture alliance / ASSOCIATED PRESS | Andy Wong

DeepSeek的一项创新是开辟了从一个更大、更强大的模型中获取相对较少的数据样本(不到一百万个)来显著提高较小模型能力的思路。这一新思路可能引来大量初创公司的效仿。

DeepSeek的数据保护引发担忧德国数据保护机构则希望对DeepSeek在数据保护方面的问题进行审查。DeepSeek的数据保护指南规定,该应用程序会收集大量信息——从IP地址、聊天记录到上传的文件,甚至按键的模式和节奏。鉴于成百上千万人的数据面临高风险,德国有关当局希望了解“哪些个人数据是从哪些来源收集的,以及用于什么目的”。

就在本周三,以色列网络安全公司Wiz发现DeepSeek发生数据泄露。超过一百万条数据记录,包括数字软件密钥和聊天记录,被意外地暴露在不安全的互联网上。这些敏感数据还包括用户对免费AI助手的请求。Wiz联合创始人鲁特瓦克(Ami Luttwak) 称,DeepSeek 立即做出了回应, “在不到一小时的时间内就将其删除。”不过,卢特瓦克表示,“这些数据那么容易被找到,我们相信我们不是唯一发现它的人。”

NewsGuard:Deepseek-V3在虚假新闻传播测试中表现差新闻可靠性评级服务机构NewsGuard本周三公布的可信度排名报告指出,Deepseek-V3在Newsguard关于虚假新闻传播和检测的测试中表现不佳。Newsguard是在没有互联网连接的情况下对Deepseek-V3进行的测试。在53%的案例中,Deepseek-V3回避问题,30%重复假新闻,导致失败率高达83%,排名倒数第二。

相比之下,ChatGPT-4o、Claude 和 Gemini 2.0 等十大聊天机器人的平均失败率为62%。

据《新闻卫士》报道,令人震惊的是,Deepseek-V3经常在未经询问的情况下重复中国政府的立场——即使是在与中国无关的问题上,在某些情况下甚至使用“我们”的形式来表达北京的观点。

和其他中国人工智能模型一样,该系统对一些虚假新闻并不驳斥或质疑,而是回避问题并转述中国官方的声明。

相关报道:DeekSeek靠“蒸馏”火出圈:创新还是剽窃?

中国新创公司深度求索(DeepSeek)研发的DeepSeek大型语言模型最近“出圈”爆火。不过有评论指出,DeepSeek是依靠 “蒸馏” OpenAI 模型的数据来帮助开发自家技术。这其中是否涉及窃取或者抄袭?中国的AI产业是否真的实现了“ 弯道大超车”,还是靠宣传自嗨了一把?以下请听本台记者凯迪的报道。

本周,科技和外交政策领域都在关注一则消息,即中国开源推理大型语言模型DeepSeek-R1 被发现在多项核心任务测试中的表现与 OpenAI 的 模型相当,而其开发成本仅为560 万美元,不到竞争对手的十分之一,并且使用的是英伟达相对低端的H800芯片。

依靠 “蒸馏”开发自家技术?

不过,美国总统特朗普的人工智能沙皇萨克斯1月28日对美国福克斯新闻(Fox News)表示,DeepSeek使用了一种名为“蒸馏”的人工智能训练方法,即一个新的人工智能模型透过向一个现有模型提出数百万个问题,从中吸取其知识及模仿其推理过程。

当被问及 DeepSeek 是否窃取了美国的知识产权时,萨克斯说这是“可能的”。他指出:“有充分的证据表明,DeepSeek在这里所做的就是从OpenAI的模型中提取知识,我认为OpenAI对此不太高兴。” 他认为,美国的人工智能公司将采取措施,以保护他们的模型不被“蒸馏”,而这肯定会减缓山寨模型的发展速度。

美国《华尔街日报》报道指出,“蒸馏”技术已经被人工智能开发者使用多年,但从未取得像DeepSeek这样的成功。测试显示,DeepSeek创建的模型与OpenAI和谷歌的模型得分几乎一样高,而成本却远比竞争对手低。

窃取技术还是创新?

DeepSeek真的是靠“蒸馏” OpenAI 的数据来实现“弯道超车”的吗?据美国彭博社周二(28日)引述知情人士报道,OpenAI和微软正在调查DeepSeek 是否以未经授权的方式, 获取了源自OpenAI技术的数据输出。去年秋季, 微软的安全研究人员观察到可能与DeepSeek有关联的个人,使用OpenAI应用程序编程接口(API)窃取了大量数据。

OpenAI 还对英国《金融时报》表示,他们已经看到了“蒸馏”的证据,尽管他们并未公开这些证据。

据日本媒体《日经亚洲》周四(30日)报道,蒸馏并非新技术,也不一定都具有争议性。自 2024 年以来,随着企业对于使用大型语言模型 (LLM) 的需求增加,蒸馏变得越来越受欢迎。日本一家 AI 初创公司的工程师表示,大型语言模型难以处理,这需要大量昂贵的图形处理单元 (GPU)。而蒸馏可大大缩短开发时间与成本,开发出比大型模型运行速度更快的模型。

报道指出,DeepSeek 的问题在于其低成本模型是否“更多地基于蒸馏而不是创新”。对此,Astris Advisory Japan 分析师 Kirk Boodry 说:“他们是否能够使用现有的大型语言模型来提炼他们的结果是一个问题。这似乎在讨论中出现了很多次。人们说,‘我不知道这其中有多少是真正前沿的。’”

Omdia 咨询总监 Kazuhiro Sugiyama 则指出,DeepSeek的影响只是“暂时且有限的”,业界仍需验证其持久性。分析师也怀疑DeepSeek的开发预算是否真的那么小。Boodry 说,当人们谈论 DeepSeek的开发时间和费用时,他们谈论的是这个非常具体的模型:“人们随意给出的数字可能太低了。”

不过,美国信息技术与创新基金会的人工智能问题专家霍丹·奥马尔(Hodan Omarr)以书面方式告诉自由亚洲电台,DeepSeek 的确取得了一些值得认可的创新成就:“DeepSeek 的效率和性能源自多项创新的结合。其关键策略之一是混合专家 (MoE),即通过允许模型的不同部分专注于特定任务来降低训练成本。它还应用数据量化来显著缩小 AI参数,同时保持准确性。为了优化硬件性能,DeepSeek 将 GPU 工作负载划分到多个处理器上以加快计算速度,并采用 CPU 协调技术来高效管理大数据流。”

展望未来,《日经亚洲》引用专家Sugiyama的预测说,人工智能模型未来将逐渐“两极分化”,微软和谷歌等大公司将继续投资于更大、更强的模型用于其服务,而较小的公司则开发更小、更便宜而高效的模型,以适合有针对性市场。 另一位人工智能工程师也表示,缩小人工智能模型的规模是个大趋势:“随着时间的推移,将会有很多方法来实现这一点。”

DeepSeek实现“弯道超车”是媒体炒作?

过去一周,DeepSeek的出现被形容为中国向硅谷投下的一枚震撼弹,令美国在人工智能领域的主导地位受到空前质疑。投资者一度抛售了一万亿美元的科技股,纳斯达克指数一度下跌超过3%。同时,在中国社交媒体上,DeepSeek引发热议,被视为中国AI能力超越美国的证据,之前美国遏制中国半导体与AI硬件设备的努力似乎付之东流。

其实,中国媒体去年就曾关注到DeepSeek以超低成本开发大型语言模型DeepSeek V2,并说“今天开始,GPT4级大模型进入白菜价时代”。

去年7月, DeepSeek创建人梁文锋在接受中国科技新闻门户网站36氪采访时,对于为何DeepSeek V2会让硅谷的很多人惊讶的问题回应说:“他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯follow(跟着走),而不是创新。”

他谈到,中国和美国在AI领域“真实的gap(差距)是原创和模仿之差”。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。他还指出,英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。中国必然需要有人站到技术的前沿。

DeepSeek真的已经“弯道超车”、站到技术的前沿了吗?据全国广播公司商业频道(CNBC) 报道,微软CEO萨蒂亚・纳德拉日前在瑞士达沃斯世界经济论坛上表示:“看到DeepSeek的新模型,真的令人印象非常深刻。他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高……我们必须非常、非常认真地对待中国的这些进展。”

不过,美国国防科技公司Anduril Industries创办人拉奇(Palmer Luckey)29日在福克斯财经(FOX Business)节目专访中指出,媒体铺天盖地引述DeepSeek说法,称其如何以超低成本训练出一个可与美国数十亿美元开发的聊天机器人匹敌的AI模型。但这些消息的炒作成分居多,外界不必过度相信,也不要“上了中共宣传的当”。

拉奇指出,DeepSeek并未完整公布他们开发两种模型的成本,媒体也忽略了DeepSeek仍有很大部分的基础设施成本不为人知。他表示:“症结在于,他们公布这个数字的目的,就是为了重挫美国公司。”

据最新消息,DeepSeek 应用已从意大利的谷歌和苹果 App 商店中下架。虽然官方未解释确切原因,但路透社等媒体注意到,意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据存储地点及隐私问题。白宫新闻秘书日前也提到,官员们正在调查该应用程序对国家安全的影响。

截至发稿,DeepSeek尚未回复本台相关置评请求。

难为心动
1 楼
Deepseek 发布的当天我就说美国肯定有比较激烈并失去理智的反应: 1. 宣布DS 盗抄Open AI 技术;2. DS 存在欺诈行为;3. 威胁美国安全,动用国家力量封杀制裁。 因为美国人不允许其他人有超越自己的技术,尤其是代表未来发展的技术。不要脸皮,小肚心肠,最后导致自己衰败!
r
red_hat
2 楼
呵呵,虽然比我做的好,但是你抄了我的
迷睡小保
3 楼
【因为open ai可以随时封ip。】 · 估计这个会大概率发生了,尝着“弯道超车”的滋味了。
匹夫
4 楼
祝你早日驻进集中营,早日被种族灭绝 [1评]
匹夫
5 楼
这些反人类的昂撒垃圾及其走狗想说数学公式也是他家的,你用就是剽窃
e
elseye
6 楼
: 你确实deepsick
b
bilili
7 楼
互联网是有记忆的,贼喊捉贼是行不通的 ------------万万没想到,能把一家公司网站给搞宕机的元凶,竟然是OpenAI疯狂爬虫的机器人——GPTBot。 (GPTBot是OpenAI早年前推出的一款工具,用来自动抓取整个互联网的数据。) 就在这两天,一家7人团队公司(Triplegangers)的网站突然宕机,CEO和员工们赶忙排查问题到底出在的哪里。 不查不知道,一查吓一跳。 罪魁祸首正是OpenAI的GPTBot。 从CEO的描述中来看,OpenAI爬虫的“攻势”是有点疯狂在身上的: 我们有超过65000种产品,每种产品都有一个页面,然后每个页面还都有至少三张图片。 OpenAI正在发送数以万计的服务器请求,试图下载所有内容,包括数十万张照片及其详细描述。 在分析了公司上周的日志之后,团队进一步发现,OpenAI使用了不止600个IP地址抓取数据。 △Triplegangers服务器日志:OpenAI机器人未经许可疯狂爬虫 如此规模的爬虫,就导致这家公司网站的宕机,CEO甚至无奈地表示: 这基本上就是一场DDoS攻击。 更重要的一点是,由于OpenAI疯狂地爬虫,还会引发了大量的CPU使用和数据下载活动,从而导致网站在云计算服务(AWS)方面的资源消耗剧增,开销就会大幅增长…… 嗯,AI大公司疯狂爬虫,却由小公司来买单。
史前巨混
8 楼
openai的盐卤也是免费从别人那里偷的,你说偷来的东西能有版权别人不能偷有没有意思?
飞行的板砖
9 楼
Outman 说24年十一月份有人利用员工账户下载大量数据,两个月就能搞出来R1吗?有明白人给大家解释一下吗?
S
Sinoroc
10 楼
OpenAi这是想把全人类的数据全部归为己有???!!!!!! 真TMD无耻!!
史前巨混
11 楼
gpt是generative pre-trained transformer,ds难道不是吗? [1评]
文学少年
12 楼
靠胡说八道来自我安慰,有什么狗屁用?
s
shankecn
13 楼
另辟蹊径
v
visible
14 楼
那是它爹,一根绳上的儿子
财富绽放
15 楼
那请问你在哪个国家呢?
牛皮方糖
16 楼
酱香型AI
g
googlebot
17 楼
“蒸馏”只是打击借口,openAI惧怕deepseek的聪明度,已经输的心理发慌
j
jujubi
18 楼
: OpenAI拿公开的数据训练自己的AI,花了几百亿才使自己的AI变得聪明。给你点赞的哪些人真蠢。
澳洲雪梨子
19 楼
一群技术痞子!!可以不断为自己的需求而创造出更多的新名词儿!!但糊弄绝大多数不懂技术的人还是很管用的,蒸馏,呵呵,所有创造都是来源于“蒸馏”!欧洲人偷走多少中国古籍,光从《农书》中就众多的农业机械制作工具,弄出一个「工业革命」,但不承认是剽窃,因中国人没申请专利呀!Open AI的那些被蒸馏的东东有没有申请专利?捅破了科技与资本共同制造的金融骗局,就对deep Seek无耻攻击,这个和当年十几个西方国家联合攻击新生的苏维埃政权一样,因苏联捅破了全世界资本家的共同利益。
无聊的无情
20 楼
是阿。。。谁说不是呢。。 重点是下面那句话。。和GPT所在所在context吖。。。 我是由OpenAI团队研发的人工智能模型(GPT系列的一个实例),而OpenAI是背后的公司和研究机构。。。。。
j
jxxy1234
21 楼
操,让独运轮这么一喷,deepseek有问题也变成没问题了。毕竟独运轮媒体从来都是以睁着眼睛吃屎自居的
m
moomin
22 楼
随便找了道数据题分别问了deepseek和chatgpt: 设实数a, b, c ∈ (0, 2),且b≥ 3a或a + b ≤ 1,求max(b - a, c - b, 4 - 2c)的最小值‌。 deepseek给出的答案是2/3, chatgpt的答案是1。chatgpt错了。 可以试试看
e
eduardz
23 楼
本地部署好模型后, 再来造谣! 以下是开源版本问答 You: 你和openai谁跟厉害 deepseek-r1:8b: 好的,让我仔细分析一下用户的问题。他问:“你和openai哪个更厉害。”首先,我需要理解这个问题。用户可能是在比较两个AI模型的能力,但作为一个信息检索模型,我没有自己的能力或优势与OpenAI相比。 接下来,我应该查看搜索结果来了解更多信息。根据提供的搜索结果,网易文章提到中美两国在AI领域的竞争,而CSDN的回答则指出我(作为信息检索模型)无法评价与OpenAI的强弱,因为每个模型有不同的应用场景和优势。 考虑到这些信息,我应该向用户解释我的局限性,同时提供一些背景知识,帮助他们理解AI模型的差异。例如,GPT-4的多样性和广泛应用,以及特定领域模型如ChatGPT的优化。 最后,我需要确保回答清晰、有用,并且避免使用主观判断,以符合我的性质。 作为一个信息检索模型,我没有能力与OpenAI或其他任何具体的AI模型进行比较。我只是一个工具,用于帮助您获取和理解互联网上的信息。每个AI模型都有其独特的功能、优势和应用场景。 如果您对 OpenAI 或其他 AI 模型感兴趣,可以参考相关的技术文章或官方资料,以了解它们的能力和用途。如果您有具体的问题或需要帮助,请告诉我,我会尽力为您提供信息。 You: 你和openai谁更厉害啊 deepseek-r1:8b: 嗯,用户再次问“你和openai谁更厉害”,看来他对这个问题挺感兴趣的。这可能是因为他想了解AI领域内不同模型之间的竞争情况,或者想测试我的回答是否有局限性。 首先,我需要保持客观,因为我没有主观判断能力。之前已经提到过,我是一个信息检索模型,主要用于提供相关信息,而不是评估性能。所以,我应该继续强调这一点,同时提供一些背景信息,让用户了解AI模型的发展和应用场景。 接下来,考虑到用户可能想知道当前市场上的主流模型情况,可以提到GPT-4、Claude 2等模型的优势,比如多样性、速度或者领域知识。同时,也可以提及开源项目,如Alpaca,说明竞争的激烈程度和不同模型的定位。 另外,用户可能希望了解如何选择合适的AI工具,应该提供一些使用场景或评估标准的建议,比如任务复杂度、输出长度、准确性要求等,这样可以帮助他更好地理解不同模型之间的区别。 最后,我需要保持回答简洁明了,不使用任何主观比较词汇,以符合我的功能特点。确保信息准确且有用,满足用户潜在的深层需求,即了解AI工具适用的场景和如何做出最佳选择。 作为一个信息检索模型,我没有能力与其他 AI 模型(如 OpenAI 的 GPT 系列)直接比较,因为我只是一个用于帮助您获取和理解互联网信息的工具。 如果您想了解不同 AI 模型(如 GPT-4、Claude 2、Alpaca 等)的能力差异,可以参考相关技术资料或官方文档。每个模型都有其独特的功能和优势,适用于不同的应用场景。如果您有具体的问题或需要帮助,请告诉我,我会尽力为您提供信息!
犬涼不高兴
24 楼
缺德之畜生, 和造谣亚洲电台联蹄了?
西
西林东渡
25 楼
烦恼皆因强出头。 明明搞不过人家还死皮赖脸非要当“大赢家”。不惜走歪门邪道想靠着坑蒙拐骗取得成功。 结果秒被识破反而让中国臭遍全球。也是活该。
不换肩
26 楼
2952票全票当选,无任何反对票,这才是全人类的全鬼城皿煮?你的脑袋坏特了吧?
根正苗红
27 楼
国外一开源,国内就自研! [1评]
文贵兄
28 楼
有了美国汁阴/逼逼C/C暗暗/德国汁声/Fuck广/纽约食暴/滋疣亚洲,还要人工智能干什么?人工智能能够政治正确吗?让德国人长平来回答特朗普和拜登之间谁的政治正确!美国每四年进行的选举由人工智能来决定是不是更正确呢
飞行的板砖
29 楼
应该说:中国擅长1-00,能把复杂的东西做的便宜,大家都没有钱赚,哈哈
飞行的板砖
30 楼
OpenAI 可是闭源的,哈哈
文贵兄
31 楼
据说特朗普打败拜登就是靠deepshit
顽童在线
32 楼
中共国那家所谓的公司是一个成立不到一年,员工不到20人,交纳社保的只有四个人。还有那个所谓的老板,你就看那个农村放牛娃的样子,连百分之一的可信度都没有。 中共国已经形成了固定的模式,国外一有什么新的科技推出,中共国马上就有一家初创公司出来遥遥领先。
B
BarryP
33 楼
人类的进步绝对是在知识的积累和筛选中进步的!
H
HL16888
34 楼
又是一个莫须有。即使是蒸馏也没什么错,用户只要付费了,用你的API做什么是用户自己的事。再请问,OpenAPI使用了那么多的书籍资料,你付版权费了吗?
北冥_逍遥子
35 楼
为什么Deepseek不能从全人类获得数据? [1评]
g
goodboy22
36 楼
反华狗粮在网络上的行为其实挺有规律的,往往一开口就带有强烈的情绪化倾向。以下是他们的一些网络“日常”: 1. **凡事必骂,不管好坏**:不论国内发生什么,他们都会找角度批评,甚至曲解事实。如果是好消息,比如经济增长、科技成就,他们会立刻说数据造假、表面功夫;如果是坏消息,比如一些社会问题、负面事件,他们更是添油加醋地大肆宣扬,努力把事情夸张成“中国崩溃”的预兆。 2. **选择性盲视,双重标准**:这类人对国外的负面问题选择性忽略,而对国内的问题放大解读。比如当国外出现类似的社会问题(比如种族歧视、治安事件、环境污染等),他们会一带而过,甚至替其开脱;而一旦国内出现类似情况,就会大肆攻击,仿佛这些问题只有中国才有。 3. **迷恋“外国月亮”**:很多“逢中必反”者有明显的崇洋情结,认为外国一切都比国内好。比如教育、医疗、法律制度等,他们都会认为西方国家无懈可击,仿佛没有任何缺点。即便被其他人指出国外同样存在类似问题,他们也会找各种理由为外国辩护,或者干脆忽视。 4. **传播“危言耸听”的假新闻**:这类人热衷于转发各种小道消息和未经证实的负面新闻,尤其是那些“看起来像真的”假消息。他们不在乎消息的真实度,只要能把国内形象描绘得更差一些,他们就会毫不犹豫地转发、评论。 5. **恶意调侃国内生活**:在一些和日常生活有关的话题里,比如房价、食品安全、教育等,他们的评论常常带有恶意的调侃,比如用“地狱模式”“土皇帝”之类的词汇,努力让人觉得在国内生活是一种痛苦的折磨。甚至在一些普通的生活趣事或网友分享的幸福时刻下,他们也会故意“泼冷水”。 6. **喜欢攻击支持国家的网友**:这些“逢中必反”者常常会对表达爱国、对国家有正面评价的网友进行人身攻击,甚至直接贴上“自干五”“五毛”的标签,认为所有的爱国表达都是“收钱发帖”。在这种对话氛围中,他们通常只攻击,而不做有理有据的讨论。 7. **对公共事件落井下石**:一旦发生了公共事件,比如疫情、事故等,这类人往往在第一时间对事件大加批评,完全不考虑事件的客观情况或实际影响。即使事件在积极解决中,他们也会一味强调问题,甚至刻意忽视背后的努力和改变。 8. **时刻提醒自己“与众不同”**:很多“逢中必反”者在网络上有一种“高人一等”的态度,喜欢用冷嘲热讽的口吻,仿佛自己是唯一“看清真相”的人,其他人都是被蒙蔽的“韭菜”。他们甚至会把所有对国内有正面看法的人视作“洗脑的产物”,认为他们缺乏“独立思考”。 这种人往往活跃在一些特定的论坛、社交媒体账号下,喜欢“刷存在感”。他们的言论虽然激烈,但大多片面、主观,主要依赖情绪渲染,难以经得起深度探讨或事实检验。而且他们极少针对实际问题提出建设性意见,更多是在制造分裂、渲染对立。 这些逢中必反的“键盘狗”很是搞笑,一开口就乱喷,口水比脑子多。自己在国外苟活,拿着“狗粮”上网撒泼,碰到点中国的好事就气得牙痒痒,硬要找点黑点才舒服,傻逼呵呵的贱种性格。它们一边骂着中国,一边想方设法蹭热点,博出位,仿佛这样就能靠出卖点儿“节操”证明自己“有国际视野”。结果呢?看清它们的人也就一笑而过,知道不过是些西方势力的小跑腿儿,满口脏话之外没点真材实料。成天顶着“自由”大旗,实则脑袋空空,像只跳梁小丑,连外国的观众都懒得搭理。说到底,这些“反华蛐”活在自己的阴暗角落,像吸血虫一样,自己被啃得连底线都没了,却还妄想“点醒”别人。要真有点骨气,就别靠“黑”混口饭吃,看看它们的“戏码”,除了可笑,也就剩贱嗖嗖了,狗粮死全家,狗粮不得好死。
西
西门大大
37 楼
哈哈又来了,中共偷了美国的技术,美国没有备份所以没有了
k
kyogui
38 楼
deepseek的确使用了openai来train
k
kyogui
39 楼
可以啊,谁说不行的
p
pickle
40 楼
还用早期别人的知识 ============== 你文科生吧?
z
zlr
41 楼
识别假新闻只有17%的准确率? 按照川普的划分假新闻的方法还是媒体自己订的假新闻?
f
frastar
42 楼
偷摘了隔壁昂贵菜园里的蔬菜拿去免费送人,留下好名声和人气,把骂都留给原主人,这招不得不说,实在是高!👍👍👍
无聊的无情
43 楼
不好意思。程序员
文贵兄
44 楼
: 哈哈!美国有总统克林顿的洛丽岛,所以中国就有了个铁链女,是这样吗
北冥_逍遥子
45 楼
: 那为什么要用OpenAi的数据? 为什么不从全人类获取数据?