有人讨论一下DeepSeek吗？老外讨论得很热烈 - 2025年1月21日北美华人网存档

大约 10 小时

楼主 (北美华人网)

目前我看到的评价就是说中国人悄悄做出了一款革命性的AI领先产品，并且是开源，价格比chatgpt便宜很多，而且不需要用那么多芯片。

DeepSeek stole the AI thunder:

- with zero hype from CEO,
- zero "omg guys it changez everythin" influencers
- no swanky demos
- no bloated promises
- no hints at "AGI achieved internally"

They did it by

shipping an actual product. pic.twitter.com/QdZmQycQ7T — Michael Kove (@michael_kove) January 20, 2025

系统提示：若遇到视频无法播放请点击下方链接
https://x.com/michael_kove/status/1881467890475606386

Riverss

大约 10 小时

btw，openai口碑好像一下变差了

anw

大约 10 小时

Open AI 是大骗子，这个是小骗子，一丘之貉

raindrop2020

大约 10 小时

这个好在哪儿？

小

小乖媽咪

大约 10 小时

anw 发表于 2025-01-21 19:46
Open AI 是大骗子，这个是小骗子，一丘之貉

中国的是免费的，能骗了你什么？

LifeIsTricky

大约 10 小时

anw 发表于 2025-01-21 19:46
Open AI 是大骗子，这个是小骗子，一丘之貉

张嘴就来啊。你是搞AI的？不懂就闭嘴，别在网上乱说话。
国产大模型这几年厚积薄发，前有deepseek 后有Minimax，特别争气。这几年国产大模型会大放异彩。

layjohns

大约 10 小时

raindrop2020 发表于 2025-01-21 19:48
这个好在哪儿？

好像最大的区别是，这个重新设计，只需要相对较少的AI芯片就训练出了很牛逼的大模型。感觉这东西给女大的冲击也不小吧，AI公司没必要拼命砸钱堆海量硬件

Riverss

大约 10 小时

layjohns 发表于 2025-01-21 19:58
好像最大的区别是，这个重新设计，只需要相对较少的AI芯片就训练出了很牛逼的大模型。感觉这东西给女大的冲击也不小吧，AI公司没必要拼命砸钱堆海量硬件

我也听说是利空女大，新技术不需要那么多芯片

xiaojiejie

大约 10 小时

吹得以为超越chatgpt了，结果用了一下，发现也就是一copilot的水平。

thymesu

大约 10 小时

Deepseek 首页有和其它工具的对比数据，有些比较专业，看不懂。听宣传说他们用的资源能源要少很多。我只用过编程这块，没有试很多，感觉deepseek给的答案稍更适合我的期望。

xiaohetiao

大约 10 小时

有Sam 在，openAI 口碑好不了

wdong

大约 9 小时

deepseek业界有口碑的。之前有过一个做数学题的kaggle比赛，所有人都用deepseek的模型，别的几个开源模型都不行。

layjohns

大约 9 小时

thymesu 发表于 2025-01-21 20:17
Deepseek 首页有和其它工具的对比数据，有些比较专业，看不懂。听宣传说他们用的资源能源要少很多。我只用过编程这块，没有试很多，感觉deepseek给的答案稍更适合我的期望。

用2048块H800显卡、耗时两个月，训出了一个6710亿参数的DeepSeek-V3。感觉有点类似华为手机，就是硬件因为现实条件受限，但是通过优化底层系统软件算法等来提升整体性能。

destiny2008

大约 9 小时

anw 发表于 2025-01-21 19:46
Open AI 是大骗子，这个是小骗子，一丘之貉

无知者无畏 openai你估计连二十块一个月的费用都舍不得交

run00

大约 9 小时

可能有无穷尽的可能路径。openai / google / meta 可以train 出来。 meta 公开如何 train 的这条路。deepseek 优化了这条路。但不能说明 deep seek 的方法可以从无数的可能性中发现一条成功的路。
所以老黄继续点钱。

Namama

大约 9 小时

raindrop2020 发表于 2025-01-21 19:48
这个好在哪儿？

同样性能，成本下降9成多

rhett_sf

大约 9 小时

居然没人提字节豆包？传说白菜价 token 生成成本

随

随意LetGo

大约 9 小时

raindrop2020 发表于 2025-01-21 19:48
这个好在哪儿？

DeepSeek 在各项指标上达到或超过 OpenAI 的模型。更厉害的是，只用了5%的算力。也就是别人用1000块芯片的，它只用50块。

facet

大约 9 小时

张嘴就来啊。你是搞AI的？不懂就闭嘴，别在网上乱说话。
国产大模型这几年厚积薄发，前有deepseek 后有Minimax，特别争气。这几年国产大模型会大放异彩。
LifeIsTricky 发表于 2025-01-21 19:53

国内同学说 DeepSeek 的 lead 是英伟达出来的，公司本身是做量化的

南

南开阿飞

大约 9 小时

Deepseek is made of this, who am I to disagree.

公

公用马甲6

大约 9 小时

刚才让deepseek做了一道工程力学物理题，答案竟然与chatGPT错成一样！

shanggj

大约 9 小时

公用马甲6 发表于 2025-01-21 20:59
刚才让deepseek做了一道工程力学物理题，答案竟然与chatGPT错成一样！

什么题？

shanggj

大约 9 小时

回复 1楼 Riverss 的帖子
怎么界面和 chatgpt 一摸一样的

layjohns

大约 9 小时

shanggj 发表于 2025-01-21 21:05
回复 1楼 Riverss 的帖子
怎么界面和 chatgpt 一摸一样的

chatgpt啥界面？不就是google，bing search界面吗？现在不就流行这种简单界面吗，还是你想说抄袭？这是开源的

公

公用马甲6

大约 8 小时

shanggj 发表于 2025-01-21 20:59
什么题？

就是这道题，你看看答案是多少？

shanggj

大约 8 小时

回复 25楼公用马甲6 的帖子
chatgpt 答案如下

deepseek 答案如下

genie05

大约 8 小时

不是之前有人说问了五次，四次Deepseek都说自己是Chatgpt吗不知道真假

mjia123

大约 7 小时

genie05 发表于 2025-01-21 22:11
不是之前有人说问了五次，四次Deepseek都说自己是Chatgpt吗不知道真假

是真的。正常的。专业人士在这个问题上都不吐槽。

shanggj

大约 7 小时

genie05 发表于 2025-01-21 22:11
不是之前有人说问了五次，四次Deepseek都说自己是Chatgpt吗不知道真假

刚试了一下，还居然是真的。

neolith2000

大约 7 小时

shanggj 发表于 2025-01-21 22:38
刚试了一下，还居然是真的。

这有啥奇怪的，训练的语料里都是ChatGPT。
这又不是符号模型。

weiyixia

大约 7 小时

chatgpt没有开源。

giver2021

大约 7 小时

为什么会有人总喜欢在自己不熟悉的领域乱发言呢

lhu2006

大约 7 小时

xiaojiejie 发表于 2025-01-21 20:06
吹得以为超越chatgpt了，结果用了一下，发现也就是一copilot的水平。

你知道国内这个投资才几个钱吗？几百万美元而已，你这copilot水平的批评，简直就是赞美了好不好？

gisclick

大约 7 小时

好用吗？

shanggj

大约 7 小时

neolith2000 发表于 2025-01-21 22:40
这有啥奇怪的，训练的语料里都是ChatGPT。
这又不是符号模型。

我问你是美国研发的还是中国研发的。它回答我是 OpenAI 研发的

neolith2000

大约 7 小时

shanggj 发表于 2025-01-21 22:45
我问你是美国研发的还是中国研发的。它回答我是 OpenAI 研发的

这样的大模型，没有经过人工对这个问题强化学习，出现这样的情况很正常

shanggj

大约 7 小时

neolith2000 发表于 2025-01-21 22:49
这样的大模型，没有经过人工对这个问题强化学习，出现这样的情况很正常

嗯，有趣

Silverwing

大约 7 小时

为什么会有人总喜欢在自己不熟悉的领域乱发言呢
giver2021 发表于 2025-01-21 22:43

因为有些人AI是外行带节奏踩中国这事，它们是专业的

claireliu

大约 6 小时

这个挺牛的，大概十年前，金融领域就开始做类似chatgpt的模型，不过是用来炒股票炒期货的模型，不开源。从那时候起金融公司就开始屯GPU和AI人才，比chatgpt大概还早而且鲜为人知，这些模型用来赚真金白银，好坏特别客观。交易公司是GPU最大客户群除了现在搞大模型这几家。国内金融公司也在卷这个。这个deepseek就是国内金融公司（幻方）的老板拉一些奥数金牌top2学生搞的。现在很多人才留在中国了，只要是公开划下道来的赛道，中国都有希望胜出，就跟奥运榜单似的，只要是even ground的竞争，中国应该都能保二争一。

LifeIsTricky

大约 6 小时

xiaojiejie 发表于 2025-01-21 20:06
吹得以为超越chatgpt了，结果用了一下，发现也就是一copilot的水平。

呵呵，又是一个癞蛤蟆打呵欠，好大的口气。给你两个numbers好好感受一下吧，

deepseek：2048 GPUs

LLaMA: 16K GPUs

你别告诉我你都不知道Llama是什么。如果这都不知道，你还好意思说这些都只是copilot。

最牛的是，deepseek 开源！虽然它是用的OpenAI models 的output 来训练的（所以它说自己是ChatGPT或者它是OpenAI研发的，没毛病)，但它开源了！以后会有更多大模型可以达到和ChatGPT 同样的效果但比它便宜十倍、一百倍、一千倍，甚至免费。你就说这个copilot 牛不牛？

有

有点傻眼

大约 6 小时