老黄拥抱DeepSeek,公然叛变革命了!(图)

k
keweisi
楼主 (北美华人网)
m
minqidev
英伟达首页。
知道为什么把,我帮大家分析把。 今天chat gpt 发布了 Chat GPT o3.
但是o3的数据截至时间是 2021年9月。也就是说,即使chat gpt有世界上最好的硬件,但是没有DeepSeek类似的人才, 他们并不能完全训练完自己的数据,这个时间可能最终长达2-3年。与之对应的是,DeepSeek的R1,训练到了2023年10月,这么大量的数据却可以这么快的训练完,这既是实力了。
而AI,其实比的是人才,比的是数学。也就是说,考虑到5个月的测试和应用时间,Deepseek至少能做到每年训练出1到2个完全新的大模型。再考虑到DeepSeek的人才储备,你说你会怎么选择。
e
eda2k4
这是皮衣见过懂王以后的事?
大衣被禁
应该是见过懂王。懂王说,刁,very very good friend.批准了。
f
feo
大衣被禁 发表于 2025-01-31 22:58
应该是见过懂王。懂王说,刁,very very good friend.批准了。

那股票得继续涨了吧
f
feifeiduan
这是昨天的新闻,今天还没口风透露呢
今天要是不让他卖,周一股市继续跌给川大看呗。
黄可是被请去的,不是被提审过去的
d
destiny2008
minqidev 发表于 2025-01-31 22:51
英伟达首页。
知道为什么把,我帮大家分析把。 今天chat gpt 发布了 Chat GPT o3.
但是o3的数据截至时间是 2021年9月。也就是说,即使chat gpt有世界上最好的硬件,但是没有DeepSeek类似的人才, 他们并不能完全训练完自己的数据,这个时间可能最终长达2-3年。与之对应的是,DeepSeek的R1,训练到了2023年10月,这么大量的数据却可以这么快的训练完,这既是实力了。
而AI,其实比的是人才,比的是数学。也就是说,考虑到5个月的测试和应用时间,Deepseek至少能做到每年训练出1到2个完全新的大模型。再考虑到DeepSeek的人才储备,你说你会怎么选择。

这是没舍得花20块钱吧
m
minqidev
feifeiduan 发表于 2025-01-31 23:04
这是昨天的新闻,今天还没口风透露呢
今天要是不让他卖,周一股市继续跌给川大看呗。
黄可是被请去的,不是被提审过去的

AMD, 微软,英伟达,甚至ASML都搭建了自己的DeepSeek. 以前这种类似Chat GPT O1,无限制接口的入场费是800亿美元,现在完全免费。
m
minqidev
destiny2008 发表于 2025-01-31 23:05
这是没舍得花20块钱吧

我是有20块的呀。
l
liucoan
eda2k4 发表于 2025-01-31 22:56
这是皮衣见过懂王以后的事?

同问! 敏感的时间节点啊,如果没懂王的同意,老黄这是找死啊!
m
minqidev
这是没舍得花20块钱吧
destiny2008 发表于 2025-01-31 23:05

你的账号不是每个月花20的? GPT-4比DeepSeek R1差太多了。 目前能和DeepSeek R1比的是 O1还有O3
GPT-4系列的是2024年的。 但是 GPT-O1 和 GPT-O3, 这些类似DeepSeek R1的,数据都是2021年的。

w
windy23
现在奥特曼社交媒体上被问最多的一句话
啥时候开源?
渔非凡
minqidev 发表于 2025-01-31 23:07
AMD, 微软,英伟达,甚至ASML都搭建了自己的DeepSeek. 以前这种类似Chat GPT O1,无限制接口的入场费是800亿美元,现在完全免费。

800亿这么贵? 那现在的架势就是open AI要死?
f
feifeiduan
liucoan 发表于 2025-01-31 23:09
同问! 敏感的时间节点啊,如果没懂王的同意,老黄这是找死啊!

显然不是。
他昨天自己说上架DeepSeek,川大请他今天去见
川普现在不敢动NVDA。
川普就职典礼没请他,他立刻去中国赞三折机。

m
minqidev
800亿这么贵? 那现在的架势就是open AI要死?
渔非凡 发表于 2025-01-31 23:12

微软800亿都已经出了。还不给源代码。
l
liucoan
windy23 发表于 2025-01-31 23:11
现在奥特曼社交媒体上被问最多的一句话
啥时候开源?

奥特曼现在真是油锅蚂蚁
d
destiny2008
minqidev 发表于 2025-01-31 23:09
你的账号不是每个月花20的? GPT-4比DeepSeek R1差太多了。 目前能和DeepSeek R1比的是 O1还有O3
GPT-4系列的是2024年的。 但是 GPT-O1 和 GPT-O3, 这些类似DeepSeek R1的,数据都是2021年的。


你要说DS成本低还行,论功能DS照4o差距还不小
渔非凡
liucoan 发表于 2025-01-31 23:15
奥特曼现在真是油锅蚂蚁

他就是见利忘义的小人。现在被他驱逐的合伙人估计要笑了,报应来得有点快
m
minqidev
你要说DS成本低还行,论功能DS照4o差距还不小
destiny2008 发表于 2025-01-31 23:15

昨天晚上就有人发帖,做一个自己出的数学题,就是一个截图。完全是论坛人自己出的。 4O大概打50分把, R1可以打95, O1差不多90-95.
其实光从数学模型来讲R1比O1都厉害很多,差不多就是 奥赛冠军和高考状元的差距。 但是4O大概就是大专生水平。 数学是工程的基础,水平基本上能看出来了。
渔非凡
minqidev 发表于 2025-01-31 23:15
微软800亿都已经出了。还不给源代码。

这么坑,能退钱吗?
e
eda2k4
liucoan 发表于 2025-01-31 23:15
奥特曼现在真是油锅蚂蚁

怎么可能,奥特曼有懂王的5000亿,稳得很
t
teadances
OpenAI 看来是不行了。现在看去年的闹剧,突然觉得SAM 真是走错一步棋,满盘皆输。如果去年和IIYA 没有分歧,坚持开源,也不至于这样。
d
destiny2008
minqidev 发表于 2025-01-31 23:18
昨天晚上就有人发帖,做一个自己出的数学题,就是一个截图。完全是论坛人自己出的。 4O大概打50分把, R1可以打95, O1差不多90-95.
其实光从数学模型来讲R1比O1都厉害很多,差不多就是 奥赛冠军和高考状元的差距。 但是4O大概就是大专生水平。 数学是工程的基础,水平基本上能看出来了。

笑而不语 你高兴就好
f
feifeiduan
现在所有美国国内的美国本土AI又重新站在一个起跑线上了。
即谁先弄出成本近似DeepSeek的开源AI,谁就得到美国本土AI市场,政府机构各大院校的大单
渔非凡
feifeiduan 发表于 2025-01-31 23:25
现在所有美国国内的美国本土AI又重新站在一个起跑线上了。
即谁先弄出成本近似DeepSeek的开源AI,谁就得到美国本土AI市场,政府机构各大院校的大单

但是中国内部也在竞争
l
liucoan
teadances 发表于 2025-01-31 23:22
OpenAI 看来是不行了。现在看去年的闹剧,突然觉得SAM 真是走错一步棋,满盘皆输。如果去年和IIYA 没有分歧,坚持开源,也不至于这样。

现在马斯克被窝里都能笑出猪声
f
feifeiduan
渔非凡 发表于 2025-01-31 23:28
但是中国内部也在竞争

是啊,不过美国肯定不会用中国的AI,所以美国国内就是自己的几个Ai在竞争政府和学术机构的单
L
LamourEstIci
minqidev 发表于 2025-01-31 22:51
英伟达首页。
知道为什么把,我帮大家分析把。 今天chat gpt 发布了 Chat GPT o3.
但是o3的数据截至时间是 2021年9月。也就是说,即使chat gpt有世界上最好的硬件,但是没有DeepSeek类似的人才, 他们并不能完全训练完自己的数据,这个时间可能最终长达2-3年。与之对应的是,DeepSeek的R1,训练到了2023年10月,这么大量的数据却可以这么快的训练完,这既是实力了。
而AI,其实比的是人才,比的是数学。也就是说,考虑到5个月的测试和应用时间,Deepseek至少能做到每年训练出1到2个完全新的大模型。再考虑到DeepSeek的人才储备,你说你会怎么选择。

你这啥软件来集成所有LLM
H
Harenough
liucoan 发表于 2025-01-31 23:28
现在马斯克被窝里都能笑出猪声

他笑不出来,可能要开始哭。
照这样发展,中国的自动驾驶会1,2年就甩Tesla 一大截,而且有大量的data training.
他现在在美国还没有上路,北京也还没有批准他的自驾。

l
liucoan
Harenough 发表于 2025-01-31 23:38
他笑不出来,可能要开始哭。
照这样发展,中国的自动驾驶会1,2年就甩Tesla 一大截,而且有大量的data training.
他现在在美国还没有上路,北京也还没有批准他的自驾。


那是后天需要考虑的事,现在他是开心的不要不要的
f
facet
渔非凡 发表于 2025-01-31 23:17
他就是见利忘义的小人。现在被他驱逐的合伙人估计要笑了,报应来得有点快

没有 Ilya 的 OpenAI 啥也不是 奥特曼会写一行代码吗? 奥特曼会算一个简单梯度吗? I doubt
i
iamcs1983
minqidev 发表于 2025-01-31 23:18
昨天晚上就有人发帖,做一个自己出的数学题,就是一个截图。完全是论坛人自己出的。 4O大概打50分把, R1可以打95, O1差不多90-95.
其实光从数学模型来讲R1比O1都厉害很多,差不多就是 奥赛冠军和高考状元的差距。 但是4O大概就是大专生水平。 数学是工程的基础,水平基本上能看出来了。

只是一道数学题能说明什么问题,不是应该用很多题目来测试吗? 还有人评测说ds的新闻和信息准确率只有17%,只能排十几名。
渔非凡
facet 发表于 2025-01-31 23:42
没有 Ilya 的 OpenAI 啥也不是 奥特曼会写一行代码吗? 奥特曼会算一个简单梯度吗? I doubt


其实当时宫变我也没特别跟。是不是Ilya要坚持开源,Altman变初心要收钱,Ilya联合董事会把奥特曼开除,然后公司员工暴乱逼迫Ilya辞职,奥特曼甄嬛回宫?
m
minqidev
LamourEstIci 发表于 2025-01-31 23:34
你这啥软件来集成所有LLM

就chat gpt plus. 在浏览器,可以切换模型。
m
minqidev
只是一道数学题能说明什么问题,不是应该用很多题目来测试吗? 还有人评测说ds的新闻和信息准确率只有17%,只能排十几名。
iamcs1983 发表于 2025-01-31 23:45

专门的机构有专门测数学题呀。能和R1比的只有 Chat GPT O1, 至于那个人说的Chat GPT 4o, 根本连桌子都上不了。像AIME, Chat GPT 4o只能打10多分。
DeepSeek R1和Chat GPT O1, 水平都很高。 Chat GPT 4o和前面这两个有差距。

w
weiyixia
这才几天,一堆大厂,Meta, ms, amazon, nvda.....都吧deepseek用到自家ai里了,这些可不是差钱的主,再说本来meta, ms的ai就还行,不比open ai差多少。这就就说明问题了。不知道还想diss DS是什么心理? 这些大厂还不如你懂?
l
layjohns
第一天震惊,咋办,咋办,这到底用啥话术打压它? 第二天开始黑,倒粪一样翻来覆去那几句,外加一句让子弹飞一会。指控抄袭套壳,但是这玩意开源自己看源码;指控间谍都是本土的也没在那些公司工作过;指控蒸馏,chatgpt咋不自己蒸自己,左脚踩右脚很快就上天了? 第三天打不过就加入,小札说得好,感谢发表,我们要采用某些技术
m
minqidev
layjohns 发表于 2025-01-31 23:54
第一天震惊,咋办,咋办,这到底用啥话术打压它? 第二天开始黑,倒粪一样翻来覆去那几句,外加一句让子弹飞一会。指控抄袭套壳,但是这玩意开源自己看源码;指控间谍都是本土的也没在那些公司工作过;指控蒸馏,chatgpt咋不自己蒸自己,左脚踩右脚很快就上天了? 第三天打不过就加入,小札说得好,感谢发表,我们要采用某些技术

Meta, 组成了四个绝密部门,都安装了DeepSeek,然后分块分析源代码。 结果被人把消息透露出来了,小札说要找出那个泄密的。
l
layjohns
minqidev 发表于 2025-02-01 00:00
Meta, 组成了四个绝密部门,都安装了DeepSeek,然后分块分析源代码。 结果被人把消息透露出来了,小札说要找出那个泄密的。

主要是这次黑没起到效果,很多人在那里嘲笑chatGPT,你一个闭源的好意思说开源的?你指控人家用你数据,你自己一脑门官司,互联网上未经允许抓数据训练用,你咋有脸说这话?
M
MingzeXi
笑而不语 你高兴就好
destiny2008 发表于 2025-01-31 23:23

deepseek R1出来第一天就能联网搜索实时消息, 准确率比 4O 高, chatgpt 的 O1 到现在都没办法使用search 功能, 昨天 O3 mini 出来了才能用 O3 mini 结合 search. 后面deepseek 开始被黑客攻击, 导致联网功能到现在都没恢复.
你说的所谓的功能无外乎就是些什么operator, search, canvas+一堆其他的 extension, 但是这些功能有没有用和LLM 模型能力直接挂钩, LLM 模型好用了, 其他 extensions 开发出来都是很短时间的事情, 比起核心的模型优化和开发门槛并不高, 而且 deepseek 目前来看并不会参与 extension 的开发, 不会搞出个类似 GPTs store 这种不务正业的东西, 他们只需要搞模型, 要搞应用其他 startup 可以自己部署本地模型, 自己蒸馏, 自己搞, 或者用 deepseek 的便宜 API.
有专业的AI领域工程师定义专门的 AI benchmark task 用来给全世界所有新的 LLM 模型测试性能, deepseek R1 和 chatgpt O1 就是目前世界上最强大的 LLM 模型, 其他的什么 4O 根本不够看. 目前除了 R1 和 O1, O3 mini, 没有其他模型能展现同等级别的 chain of thought 能力, 也就是输入 prompt 后 deepseek 展示的思考过程, 而这个能力是目前 LLM 模型最先进的能力.
S
Silverwing
iamcs1983 发表于 2025-01-31 23:45
只是一道数学题能说明什么问题,不是应该用很多题目来测试吗? 还有人评测说ds的新闻和信息准确率只有17%,只能排十几名。

那么多公开的基准测试在那摆着 你说的排10几名的测试报道呢? 贴出来瞧瞧?
一个10几名的AI模型干掉1万多亿美元市值
那改天再提高点, 还活不活了?
墨染云烟
minqidev 发表于 2025-01-31 23:07
AMD, 微软,英伟达,甚至ASML都搭建了自己的DeepSeek. 以前这种类似Chat GPT O1,无限制接口的入场费是800亿美元,现在完全免费。

就开源这件事干的太漂亮。给DS团队鼓个掌。
g
goodluckall
回复 38楼 layjohns 的帖子
哈哈,这心理过程刻画得太合适了
焱焱
eda2k4 发表于 2025-01-31 23:18
怎么可能,奥特曼有懂王的5000亿,稳得很

都是日本血包大洋葱的钱,孙正义肉包子
焱焱
墨染云烟 发表于 2025-02-01 00:50
就开源这件事干的太漂亮。给DS团队鼓个掌。

格局
h
hyckenan
回复 2楼 minqidev 的帖子
然而这个数据是错的,看文章里面cut off是23年十月,这个2021是3.5的
小东西
先拿其他账号发一张跟Deepseek有关的图,再自己假装观众跟吹。NVIDIA NIM部署的开源模型很多个,加上一个Deepseek就是叛变革命了
小东西
https://build.nvidia.com/models,这模型数量都上百了
m
minqidev
呵呵。3.5 你到底懂不懂啊. 不懂,其实没事,你用都不用,为什么也乱评论阿。
我用的版本是今天出来的叫做 Chat-GTP O3-mini-high. 这是网址 https://openai.com/index/openai-o3-mini/

排序是 Chat GPT3.5 Chat GPT4 Chat GPT4o Chat GPT O1 Chat GPT O3
有思考能力的,分别是 Chat GPT O1 和 Chat GPT O3


l
layjohns
小东西 发表于 2025-02-01 01:53
https://build.nvidia.com/models,这模型数量都上百了

几百个又咋样,正在被批斗批臭抹黑阶段,女大给上线了你等两天不行啊,女大咋这么没眼力见呢?不光女大,还有微软,亚麻今天都给上线了,你说别人看来算不算集体背书呢?
W
Wl8418
minqidev 发表于 2025-01-31 23:18
昨天晚上就有人发帖,做一个自己出的数学题,就是一个截图。完全是论坛人自己出的。 4O大概打50分把, R1可以打95, O1差不多90-95.
其实光从数学模型来讲R1比O1都厉害很多,差不多就是 奥赛冠军和高考状元的差距。 但是4O大概就是大专生水平。 数学是工程的基础,水平基本上能看出来了。

Mark
小东西
Mistral是法国的,Stable diffusion德国的,AWS Azure也早叛变了呗?但凡在这个行业工作的用一下就知道AWS的主推模型(serverless)是Claude,微软是openAi
i
iamcs1983
minqidev 发表于 2025-01-31 23:50
专门的机构有专门测数学题呀。能和R1比的只有 Chat GPT O1, 至于那个人说的Chat GPT 4o, 根本连桌子都上不了。像AIME, Chat GPT 4o只能打10多分。
DeepSeek R1和Chat GPT O1, 水平都很高。 Chat GPT 4o和前面这两个有差距。


这不是分数差不多吗?你之前为什么说R1比O1厉害很多?
小东西

跑分在这呢,这个版面带任务的,都是她用了Deepseek就是比o1强
西
西北飘雪
minqidev 发表于 2025-01-31 23:07
我是有20块的呀。

咋退掉?
a
adorp
iamcs1983 发表于 2025-01-31 23:45
只是一道数学题能说明什么问题,不是应该用很多题目来测试吗? 还有人评测说ds的新闻和信息准确率只有17%,只能排十几名。

就因为DeepSeek不采用Fake News的报道?
a
adorp
MingzeXi 发表于 2025-02-01 00:30
deepseek R1出来第一天就能联网搜索实时消息, 准确率比 4O 高, chatgpt 的 O1 到现在都没办法使用search 功能, 昨天 O3 mini 出来了才能用 O3 mini 结合 search. 后面deepseek 开始被黑客攻击, 导致联网功能到现在都没恢复.
你说的所谓的功能无外乎就是些什么operator, search, canvas+一堆其他的 extension, 但是这些功能有没有用和LLM 模型能力直接挂钩, LLM 模型好用了, 其他 extensions 开发出来都是很短时间的事情, 比起核心的模型优化和开发门槛并不高, 而且 deepseek 目前来看并不会参与 extension 的开发, 不会搞出个类似 GPTs store 这种不务正业的东西, 他们只需要搞模型, 要搞应用其他 startup 可以自己部署本地模型, 自己蒸馏, 自己搞, 或者用 deepseek 的便宜 API.
有专业的AI领域工程师定义专门的 AI benchmark task 用来给全世界所有新的 LLM 模型测试性能, deepseek R1 和 chatgpt O1 就是目前世界上最强大的 LLM 模型, 其他的什么 4O 根本不够看. 目前除了 R1 和 O1, O3 mini, 没有其他模型能展现同等级别的 chain of thought 能力, 也就是输入 prompt 后 deepseek 展示的思考过程, 而这个能力是目前 LLM 模型最先进的能力.

我最近几天在德国玩, DeepSeek工作一直不但正常而且很快,是美国几大公司甚至CIA暗自启动了对美国屁民的防火墙吗?
s
strawberrymm
外行人请教一下:有了DS,我是不是可以不花20刀了?
m
minqidev
回复 56楼 小东西 的帖子
你自己看, 数学DeepSeek R1和 最好的O1就是最好的,其他版本差距都很大。