有人讨论一下DeepSeek吗?老外讨论得很热烈

R
Riverss
楼主 (北美华人网)
目前我看到的评价就是说中国人悄悄做出了一款革命性的AI领先产品,并且是开源,价格比chatgpt便宜很多,而且不需要用那么多芯片。
DeepSeek stole the AI thunder:

- with zero hype from CEO,
- zero "omg guys it changez everythin" influencers
- no swanky demos
- no bloated promises
- no hints at "AGI achieved internally"

They did it by

shipping an actual product. pic.twitter.com/QdZmQycQ7T — Michael Kove (@michael_kove) January 20, 2025

系统提示:若遇到视频无法播放请点击下方链接
https://x.com/michael_kove/status/1881467890475606386
R
Riverss
btw,openai口碑好像一下变差了
a
anw
Open AI 是大骗子,这个是小骗子,一丘之貉
r
raindrop2020
这个好在哪儿?
小乖媽咪
anw 发表于 2025-01-21 19:46
Open AI 是大骗子,这个是小骗子,一丘之貉

中国的是免费的,能骗了你什么?
L
LifeIsTricky
anw 发表于 2025-01-21 19:46
Open AI 是大骗子,这个是小骗子,一丘之貉

张嘴就来啊。你是搞AI的?不懂就闭嘴,别在网上乱说话。
国产大模型这几年厚积薄发,前有deepseek 后有Minimax,特别争气。这几年国产大模型会大放异彩。
l
layjohns
raindrop2020 发表于 2025-01-21 19:48
这个好在哪儿?

好像最大的区别是,这个重新设计,只需要相对较少的AI芯片就训练出了很牛逼的大模型。感觉这东西给女大的冲击也不小吧,AI公司没必要拼命砸钱堆海量硬件
R
Riverss
layjohns 发表于 2025-01-21 19:58
好像最大的区别是,这个重新设计,只需要相对较少的AI芯片就训练出了很牛逼的大模型。感觉这东西给女大的冲击也不小吧,AI公司没必要拼命砸钱堆海量硬件

我也听说是利空女大,新技术不需要那么多芯片
x
xiaojiejie
吹得以为超越chatgpt了,结果用了一下,发现也就是一copilot的水平。
t
thymesu
Deepseek 首页有和其它工具的对比数据,有些比较专业,看不懂。 听宣传说他们用的资源能源要少很多。 我只用过编程这块,没有试很多,感觉deepseek给的答案稍更适合我的期望。
x
xiaohetiao
有Sam 在,openAI 口碑好不了
w
wdong
deepseek业界有口碑的。之前有过一个做数学题的kaggle比赛,所有人都用deepseek的模型,别的几个开源模型都不行。
l
layjohns
thymesu 发表于 2025-01-21 20:17
Deepseek 首页有和其它工具的对比数据,有些比较专业,看不懂。 听宣传说他们用的资源能源要少很多。 我只用过编程这块,没有试很多,感觉deepseek给的答案稍更适合我的期望。

用2048块H800显卡、耗时两个月,训出了一个6710亿参数的DeepSeek-V3。感觉有点类似华为手机,就是硬件因为现实条件受限,但是通过优化底层系统软件算法等来提升整体性能。
d
destiny2008
anw 发表于 2025-01-21 19:46
Open AI 是大骗子,这个是小骗子,一丘之貉

无知者无畏 openai你估计连二十块一个月的费用都舍不得交
r
run00

可能有无穷尽的可能路径。openai / google / meta 可以train 出来。 meta 公开如何 train 的 这条路。deepseek 优化了这条路。但不能说明 deep seek 的方法可以从无数的可能性中发现一条成功的路。
所以老黄继续点钱。

N
Namama
raindrop2020 发表于 2025-01-21 19:48
这个好在哪儿?

同样性能,成本下降9成多
r
rhett_sf
居然没人提字节豆包? 传说白菜价 token 生成成本
随意LetGo
raindrop2020 发表于 2025-01-21 19:48
这个好在哪儿?

DeepSeek 在各项指标上达到或超过 OpenAI 的模型。更厉害的是,只用了5%的算力。也就是别人用1000块芯片的,它只用50块。
f
facet
张嘴就来啊。你是搞AI的?不懂就闭嘴,别在网上乱说话。
国产大模型这几年厚积薄发,前有deepseek 后有Minimax,特别争气。这几年国产大模型会大放异彩。
LifeIsTricky 发表于 2025-01-21 19:53

国内同学说 DeepSeek 的 lead 是英伟达出来的,公司本身是做量化的
南开阿飞
Deepseek is made of this, who am I to disagree.
公用马甲6
刚才让deepseek做了一道工程力学物理题,答案竟然与chatGPT错成一样!
s
shanggj
公用马甲6 发表于 2025-01-21 20:59
刚才让deepseek做了一道工程力学物理题,答案竟然与chatGPT错成一样!

什么题?
s
shanggj
回复 1楼 Riverss 的帖子
怎么界面和 chatgpt 一摸一样的
l
layjohns
shanggj 发表于 2025-01-21 21:05
回复 1楼 Riverss 的帖子
怎么界面和 chatgpt 一摸一样的

chatgpt啥界面?不就是google,bing search界面吗?现在不就流行这种简单界面吗,还是你想说抄袭?这是开源的
公用马甲6
shanggj 发表于 2025-01-21 20:59
什么题?

就是这道题,你看看答案是多少?
s
shanggj
回复 25楼 公用马甲6 的帖子
chatgpt 答案如下

deepseek 答案如下


g
genie05
不是之前有人说问了五次,四次Deepseek都说自己是Chatgpt吗 不知道真假
m
mjia123
genie05 发表于 2025-01-21 22:11
不是之前有人说问了五次,四次Deepseek都说自己是Chatgpt吗 不知道真假

是真的。正常的。专业人士在这个问题上都不吐槽。
s
shanggj
genie05 发表于 2025-01-21 22:11
不是之前有人说问了五次,四次Deepseek都说自己是Chatgpt吗 不知道真假

刚试了一下, 还居然是真的。
n
neolith2000
shanggj 发表于 2025-01-21 22:38
刚试了一下, 还居然是真的。

这有啥奇怪的,训练的语料里都是ChatGPT。
这又不是符号模型。
w
weiyixia
chatgpt没有开源。
g
giver2021
为什么会有人总喜欢在自己不熟悉的领域乱发言呢
l
lhu2006
xiaojiejie 发表于 2025-01-21 20:06
吹得以为超越chatgpt了,结果用了一下,发现也就是一copilot的水平。

你知道国内这个投资才几个钱吗?几百万美元而已, 你这copilot水平的批评, 简直就是赞美了好不好?
g
gisclick
好用吗?
s
shanggj
neolith2000 发表于 2025-01-21 22:40
这有啥奇怪的,训练的语料里都是ChatGPT。
这又不是符号模型。

我问你是美国研发的 还是中国研发的。 它回答我是 OpenAI 研发的
n
neolith2000
shanggj 发表于 2025-01-21 22:45
我问你是美国研发的 还是中国研发的。 它回答我是 OpenAI 研发的

这样的大模型,没有经过人工对这个问题强化学习,出现这样的情况很正常
s
shanggj
neolith2000 发表于 2025-01-21 22:49
这样的大模型,没有经过人工对这个问题强化学习,出现这样的情况很正常

嗯, 有趣
S
Silverwing
为什么会有人总喜欢在自己不熟悉的领域乱发言呢
giver2021 发表于 2025-01-21 22:43

因为有些人AI是外行 带节奏踩中国这事, 它们是专业的
c
claireliu
这个挺牛的,大概十年前,金融领域就开始做类似chatgpt的模型,不过是用来炒股票炒期货的模型,不开源。从那时候起金融公司就开始屯GPU和AI人才,比chatgpt大概还早而且鲜为人知,这些模型用来赚真金白银,好坏特别客观。交易公司是GPU最大客户群除了现在搞大模型这几家。国内金融公司也在卷这个。这个deepseek就是国内金融公司(幻方)的老板拉一些奥数金牌top2学生搞的。现在很多人才留在中国了,只要是公开划下道来的赛道,中国都有希望胜出,就跟奥运榜单似的,只要是even ground的竞争,中国应该都能保二争一。
L
LifeIsTricky
xiaojiejie 发表于 2025-01-21 20:06
吹得以为超越chatgpt了,结果用了一下,发现也就是一copilot的水平。





呵呵,又是一个癞蛤蟆打呵欠,好大的口气。给你两个numbers好好感受一下吧,






deepseek:2048 GPUs






LLaMA: 16K GPUs






你别告诉我你都不知道Llama是什么。如果这都不知道,你还好意思说这些都只是copilot。






最牛的是,deepseek 开源!虽然它是用的OpenAI models 的output 来训练的(所以它说自己是ChatGPT或者它是OpenAI研发的,没毛病),但它开源了!以后会有更多大模型可以达到和ChatGPT 同样的效果但比它便宜十倍、一百倍、一千倍,甚至免费。你就说这个copilot 牛不牛?






















有点傻眼
shanggj 发表于 2025-01-21 22:45
我问你是美国研发的 还是中国研发的。 它回答我是 OpenAI 研发的

😂
N
Namama
我问你是美国研发的 还是中国研发的。 它回答我是 OpenAI 研发的
shanggj 发表于 2025-01-21 22:45

AI到处抓数据训练,如果没有人工后期调整,时不时就会出这样的问题。。
谷歌的AI当初也一度认为自己是百度的文心一言



说到底,现在的AI还没有真正的智慧和理解,只会抓取大数据里各个词汇之间的关联性

L
LifeIsTricky
Namama 发表于 2025-01-22 00:23
AI到处抓数据训练,如果没有人工后期调整,时不时就会出这样的问题。。
谷歌的AI当初也一度认为自己是百度的文心一言



说到底,现在的AI还没有真正的智慧和理解,只会抓取大数据里各个词汇之间的关联性


Deepseek是用的OpenAI models output 训练的,不是自己在网上重新抓数据训练。人工后期调整这是外行话。现在的大模型的参数基本都是billion级,很难人工调整。parameter tuning 老黄历了。
半个马和甲
国人有个超能力我真的服
啥玩意儿经过他们的手,都可以开发出(卷出)白菜价!
(成本大大的降低).

l
layjohns
半个马和甲 发表于 2025-01-22 01:41
国人有个超能力我真的服
啥玩意儿经过他们的手,都可以开发出(卷出)白菜价!
(成本大大的降低).


我们行业,近年来基于AI的技术是最热门,论文大部分来自于中国和美国,而美国的那些文章,又大部分来自于华裔教授的lab,做的是老钟博士。。