老黄拥抱DeepSeek，公然叛变革命了！(图)

7 个月

这是昨天的新闻，今天还没口风透露呢
今天要是不让他卖，周一股市继续跌给川大看呗。
黄可是被请去的，不是被提审过去的

destiny2008

7 个月

minqidev 发表于 2025-01-31 22:51
英伟达首页。
知道为什么把，我帮大家分析把。今天chat gpt 发布了 Chat GPT o3.
但是o3的数据截至时间是 2021年9月。也就是说，即使chat gpt有世界上最好的硬件，但是没有DeepSeek类似的人才，他们并不能完全训练完自己的数据，这个时间可能最终长达2-3年。与之对应的是，DeepSeek的R1，训练到了2023年10月，这么大量的数据却可以这么快的训练完，这既是实力了。
而AI，其实比的是人才，比的是数学。也就是说，考虑到5个月的测试和应用时间，Deepseek至少能做到每年训练出1到2个完全新的大模型。再考虑到DeepSeek的人才储备，你说你会怎么选择。

这是没舍得花20块钱吧

7 个月

feifeiduan 发表于 2025-01-31 23:04
这是昨天的新闻，今天还没口风透露呢
今天要是不让他卖，周一股市继续跌给川大看呗。
黄可是被请去的，不是被提审过去的

AMD, 微软，英伟达，甚至ASML都搭建了自己的DeepSeek. 以前这种类似Chat GPT O1，无限制接口的入场费是800亿美元，现在完全免费。

7 个月

destiny2008 发表于 2025-01-31 23:05
这是没舍得花20块钱吧

我是有20块的呀。

7 个月

eda2k4 发表于 2025-01-31 22:56
这是皮衣见过懂王以后的事？

同问！敏感的时间节点啊，如果没懂王的同意，老黄这是找死啊！

7 个月

这是没舍得花20块钱吧
destiny2008 发表于 2025-01-31 23:05

你的账号不是每个月花20的？ GPT-4比DeepSeek R1差太多了。目前能和DeepSeek R1比的是 O1还有O3
GPT-4系列的是2024年的。但是 GPT-O1 和 GPT-O3，这些类似DeepSeek R1的，数据都是2021年的。

windy23

7 个月

现在奥特曼社交媒体上被问最多的一句话
啥时候开源？

7 个月

minqidev 发表于 2025-01-31 23:07
AMD, 微软，英伟达，甚至ASML都搭建了自己的DeepSeek. 以前这种类似Chat GPT O1，无限制接口的入场费是800亿美元，现在完全免费。

800亿这么贵？那现在的架势就是open AI要死？

7 个月

liucoan 发表于 2025-01-31 23:09
同问！敏感的时间节点啊，如果没懂王的同意，老黄这是找死啊！

显然不是。
他昨天自己说上架DeepSeek，川大请他今天去见
川普现在不敢动NVDA。
川普就职典礼没请他，他立刻去中国赞三折机。

7 个月

800亿这么贵？那现在的架势就是open AI要死？
渔非凡发表于 2025-01-31 23:12

微软800亿都已经出了。还不给源代码。

7 个月

windy23 发表于 2025-01-31 23:11
现在奥特曼社交媒体上被问最多的一句话
啥时候开源？

奥特曼现在真是油锅蚂蚁

destiny2008

7 个月

minqidev 发表于 2025-01-31 23:09
你的账号不是每个月花20的？ GPT-4比DeepSeek R1差太多了。目前能和DeepSeek R1比的是 O1还有O3
GPT-4系列的是2024年的。但是 GPT-O1 和 GPT-O3，这些类似DeepSeek R1的，数据都是2021年的。

你要说DS成本低还行，论功能DS照4o差距还不小

7 个月

liucoan 发表于 2025-01-31 23:15
奥特曼现在真是油锅蚂蚁

他就是见利忘义的小人。现在被他驱逐的合伙人估计要笑了，报应来得有点快

7 个月

你要说DS成本低还行，论功能DS照4o差距还不小
destiny2008 发表于 2025-01-31 23:15

昨天晚上就有人发帖，做一个自己出的数学题，就是一个截图。完全是论坛人自己出的。 4O大概打50分把， R1可以打95， O1差不多90-95.
其实光从数学模型来讲R1比O1都厉害很多，差不多就是奥赛冠军和高考状元的差距。但是4O大概就是大专生水平。数学是工程的基础，水平基本上能看出来了。

7 个月

minqidev 发表于 2025-01-31 23:15
微软800亿都已经出了。还不给源代码。

这么坑，能退钱吗？

eda2k4

7 个月

liucoan 发表于 2025-01-31 23:15
奥特曼现在真是油锅蚂蚁

怎么可能，奥特曼有懂王的5000亿，稳得很

teadances

7 个月

OpenAI 看来是不行了。现在看去年的闹剧，突然觉得SAM 真是走错一步棋，满盘皆输。如果去年和IIYA 没有分歧，坚持开源，也不至于这样。

destiny2008

7 个月

minqidev 发表于 2025-01-31 23:18
昨天晚上就有人发帖，做一个自己出的数学题，就是一个截图。完全是论坛人自己出的。 4O大概打50分把， R1可以打95， O1差不多90-95.
其实光从数学模型来讲R1比O1都厉害很多，差不多就是奥赛冠军和高考状元的差距。但是4O大概就是大专生水平。数学是工程的基础，水平基本上能看出来了。

笑而不语你高兴就好

7 个月

现在所有美国国内的美国本土AI又重新站在一个起跑线上了。
即谁先弄出成本近似DeepSeek的开源AI，谁就得到美国本土AI市场，政府机构各大院校的大单

7 个月

feifeiduan 发表于 2025-01-31 23:25
现在所有美国国内的美国本土AI又重新站在一个起跑线上了。
即谁先弄出成本近似DeepSeek的开源AI，谁就得到美国本土AI市场，政府机构各大院校的大单

但是中国内部也在竞争

7 个月

teadances 发表于 2025-01-31 23:22
OpenAI 看来是不行了。现在看去年的闹剧，突然觉得SAM 真是走错一步棋，满盘皆输。如果去年和IIYA 没有分歧，坚持开源，也不至于这样。

现在马斯克被窝里都能笑出猪声

7 个月

渔非凡发表于 2025-01-31 23:28
但是中国内部也在竞争

是啊，不过美国肯定不会用中国的AI，所以美国国内就是自己的几个Ai在竞争政府和学术机构的单

LamourEstIci

7 个月

minqidev 发表于 2025-01-31 22:51
英伟达首页。
知道为什么把，我帮大家分析把。今天chat gpt 发布了 Chat GPT o3.
但是o3的数据截至时间是 2021年9月。也就是说，即使chat gpt有世界上最好的硬件，但是没有DeepSeek类似的人才，他们并不能完全训练完自己的数据，这个时间可能最终长达2-3年。与之对应的是，DeepSeek的R1，训练到了2023年10月，这么大量的数据却可以这么快的训练完，这既是实力了。
而AI，其实比的是人才，比的是数学。也就是说，考虑到5个月的测试和应用时间，Deepseek至少能做到每年训练出1到2个完全新的大模型。再考虑到DeepSeek的人才储备，你说你会怎么选择。

你这啥软件来集成所有LLM

Harenough

7 个月

liucoan 发表于 2025-01-31 23:28
现在马斯克被窝里都能笑出猪声

他笑不出来，可能要开始哭。
照这样发展，中国的自动驾驶会1,2年就甩Tesla 一大截，而且有大量的data training.
他现在在美国还没有上路，北京也还没有批准他的自驾。

7 个月

Harenough 发表于 2025-01-31 23:38
他笑不出来，可能要开始哭。
照这样发展，中国的自动驾驶会1,2年就甩Tesla 一大截，而且有大量的data training.
他现在在美国还没有上路，北京也还没有批准他的自驾。

那是后天需要考虑的事，现在他是开心的不要不要的

facet

7 个月

渔非凡发表于 2025-01-31 23:17
他就是见利忘义的小人。现在被他驱逐的合伙人估计要笑了，报应来得有点快

没有 Ilya 的 OpenAI 啥也不是奥特曼会写一行代码吗？奥特曼会算一个简单梯度吗？ I doubt

iamcs1983

7 个月

minqidev 发表于 2025-01-31 23:18
昨天晚上就有人发帖，做一个自己出的数学题，就是一个截图。完全是论坛人自己出的。 4O大概打50分把， R1可以打95， O1差不多90-95.
其实光从数学模型来讲R1比O1都厉害很多，差不多就是奥赛冠军和高考状元的差距。但是4O大概就是大专生水平。数学是工程的基础，水平基本上能看出来了。

只是一道数学题能说明什么问题，不是应该用很多题目来测试吗？还有人评测说ds的新闻和信息准确率只有17%，只能排十几名。

7 个月

facet 发表于 2025-01-31 23:42
没有 Ilya 的 OpenAI 啥也不是奥特曼会写一行代码吗？奥特曼会算一个简单梯度吗？ I doubt

其实当时宫变我也没特别跟。是不是Ilya要坚持开源，Altman变初心要收钱，Ilya联合董事会把奥特曼开除，然后公司员工暴乱逼迫Ilya辞职，奥特曼甄嬛回宫？

7 个月

LamourEstIci 发表于 2025-01-31 23:34
你这啥软件来集成所有LLM

就chat gpt plus. 在浏览器，可以切换模型。

7 个月

只是一道数学题能说明什么问题，不是应该用很多题目来测试吗？还有人评测说ds的新闻和信息准确率只有17%，只能排十几名。
iamcs1983 发表于 2025-01-31 23:45

专门的机构有专门测数学题呀。能和R1比的只有 Chat GPT O1, 至于那个人说的Chat GPT 4o, 根本连桌子都上不了。像AIME, Chat GPT 4o只能打10多分。
DeepSeek R1和Chat GPT O1, 水平都很高。 Chat GPT 4o和前面这两个有差距。

weiyixia

7 个月

这才几天，一堆大厂，Meta, ms, amazon, nvda.....都吧deepseek用到自家ai里了，这些可不是差钱的主，再说本来meta, ms的ai就还行，不比open ai差多少。这就就说明问题了。不知道还想diss DS是什么心理？这些大厂还不如你懂？

layjohns

7 个月

第一天震惊，咋办，咋办，这到底用啥话术打压它？第二天开始黑，倒粪一样翻来覆去那几句，外加一句让子弹飞一会。指控抄袭套壳，但是这玩意开源自己看源码；指控间谍都是本土的也没在那些公司工作过；指控蒸馏，chatgpt咋不自己蒸自己，左脚踩右脚很快就上天了？第三天打不过就加入，小札说得好，感谢发表，我们要采用某些技术

7 个月

layjohns 发表于 2025-01-31 23:54
第一天震惊，咋办，咋办，这到底用啥话术打压它？第二天开始黑，倒粪一样翻来覆去那几句，外加一句让子弹飞一会。指控抄袭套壳，但是这玩意开源自己看源码；指控间谍都是本土的也没在那些公司工作过；指控蒸馏，chatgpt咋不自己蒸自己，左脚踩右脚很快就上天了？第三天打不过就加入，小札说得好，感谢发表，我们要采用某些技术

Meta，组成了四个绝密部门，都安装了DeepSeek,然后分块分析源代码。结果被人把消息透露出来了，小札说要找出那个泄密的。

layjohns

7 个月

minqidev 发表于 2025-02-01 00:00
Meta，组成了四个绝密部门，都安装了DeepSeek,然后分块分析源代码。结果被人把消息透露出来了，小札说要找出那个泄密的。

主要是这次黑没起到效果，很多人在那里嘲笑chatGPT，你一个闭源的好意思说开源的？你指控人家用你数据，你自己一脑门官司，互联网上未经允许抓数据训练用，你咋有脸说这话？

MingzeXi

7 个月

笑而不语你高兴就好
destiny2008 发表于 2025-01-31 23:23

deepseek R1出来第一天就能联网搜索实时消息, 准确率比 4O 高, chatgpt 的 O1 到现在都没办法使用search 功能, 昨天 O3 mini 出来了才能用 O3 mini 结合 search. 后面deepseek 开始被黑客攻击, 导致联网功能到现在都没恢复.
你说的所谓的功能无外乎就是些什么operator, search, canvas+一堆其他的 extension, 但是这些功能有没有用和LLM 模型能力直接挂钩, LLM 模型好用了, 其他 extensions 开发出来都是很短时间的事情, 比起核心的模型优化和开发门槛并不高, 而且 deepseek 目前来看并不会参与 extension 的开发, 不会搞出个类似 GPTs store 这种不务正业的东西, 他们只需要搞模型, 要搞应用其他 startup 可以自己部署本地模型, 自己蒸馏, 自己搞, 或者用 deepseek 的便宜 API.
有专业的AI领域工程师定义专门的 AI benchmark task 用来给全世界所有新的 LLM 模型测试性能, deepseek R1 和 chatgpt O1 就是目前世界上最强大的 LLM 模型, 其他的什么 4O 根本不够看. 目前除了 R1 和 O1, O3 mini, 没有其他模型能展现同等级别的 chain of thought 能力, 也就是输入 prompt 后 deepseek 展示的思考过程, 而这个能力是目前 LLM 模型最先进的能力.

Silverwing

7 个月

iamcs1983 发表于 2025-01-31 23:45
只是一道数学题能说明什么问题，不是应该用很多题目来测试吗？还有人评测说ds的新闻和信息准确率只有17%，只能排十几名。

那么多公开的基准测试在那摆着你说的排10几名的测试报道呢？贴出来瞧瞧？
一个10几名的AI模型干掉1万多亿美元市值
那改天再提高点，还活不活了？

墨

墨染云烟

7 个月

minqidev 发表于 2025-01-31 23:07
AMD, 微软，英伟达，甚至ASML都搭建了自己的DeepSeek. 以前这种类似Chat GPT O1，无限制接口的入场费是800亿美元，现在完全免费。

就开源这件事干的太漂亮。给DS团队鼓个掌。

goodluckall

7 个月

回复 38楼 layjohns 的帖子
哈哈，这心理过程刻画得太合适了

焱

焱焱

7 个月

eda2k4 发表于 2025-01-31 23:18
怎么可能，奥特曼有懂王的5000亿，稳得很

都是日本血包大洋葱的钱，孙正义肉包子

焱

焱焱

7 个月

墨染云烟发表于 2025-02-01 00:50
就开源这件事干的太漂亮。给DS团队鼓个掌。

格局

hyckenan

7 个月

回复 2楼 minqidev 的帖子
然而这个数据是错的，看文章里面cut off是23年十月，这个2021是3.5的

7 个月

先拿其他账号发一张跟Deepseek有关的图，再自己假装观众跟吹。NVIDIA NIM部署的开源模型很多个，加上一个Deepseek就是叛变革命了

7 个月

https://build.nvidia.com/models，这模型数量都上百了

7 个月

呵呵。3.5 你到底懂不懂啊. 不懂，其实没事，你用都不用，为什么也乱评论阿。
我用的版本是今天出来的叫做 Chat-GTP O3-mini-high. 这是网址 https://openai.com/index/openai-o3-mini/

排序是 Chat GPT3.5 Chat GPT4 Chat GPT4o Chat GPT O1 Chat GPT O3
有思考能力的，分别是 Chat GPT O1 和 Chat GPT O3

layjohns

7 个月

小东西发表于 2025-02-01 01:53
https://build.nvidia.com/models，这模型数量都上百了

几百个又咋样，正在被批斗批臭抹黑阶段，女大给上线了你等两天不行啊，女大咋这么没眼力见呢？不光女大，还有微软，亚麻今天都给上线了，你说别人看来算不算集体背书呢？

Wl8418

7 个月

minqidev 发表于 2025-01-31 23:18
昨天晚上就有人发帖，做一个自己出的数学题，就是一个截图。完全是论坛人自己出的。 4O大概打50分把， R1可以打95， O1差不多90-95.
其实光从数学模型来讲R1比O1都厉害很多，差不多就是奥赛冠军和高考状元的差距。但是4O大概就是大专生水平。数学是工程的基础，水平基本上能看出来了。

Mark

7 个月

Mistral是法国的，Stable diffusion德国的，AWS Azure也早叛变了呗？但凡在这个行业工作的用一下就知道AWS的主推模型（serverless）是Claude，微软是openAi

iamcs1983

7 个月

minqidev 发表于 2025-01-31 23:50
专门的机构有专门测数学题呀。能和R1比的只有 Chat GPT O1, 至于那个人说的Chat GPT 4o, 根本连桌子都上不了。像AIME, Chat GPT 4o只能打10多分。
DeepSeek R1和Chat GPT O1, 水平都很高。 Chat GPT 4o和前面这两个有差距。

这不是分数差不多吗？你之前为什么说R1比O1厉害很多？

7 个月

跑分在这呢，这个版面带任务的，都是她用了Deepseek就是比o1强

西

西北飘雪

7 个月

minqidev 发表于 2025-01-31 23:07
我是有20块的呀。

咋退掉？

adorp

7 个月

iamcs1983 发表于 2025-01-31 23:45
只是一道数学题能说明什么问题，不是应该用很多题目来测试吗？还有人评测说ds的新闻和信息准确率只有17%，只能排十几名。

就因为DeepSeek不采用Fake News的报道？

adorp

7 个月

MingzeXi 发表于 2025-02-01 00:30
deepseek R1出来第一天就能联网搜索实时消息, 准确率比 4O 高, chatgpt 的 O1 到现在都没办法使用search 功能, 昨天 O3 mini 出来了才能用 O3 mini 结合 search. 后面deepseek 开始被黑客攻击, 导致联网功能到现在都没恢复.
你说的所谓的功能无外乎就是些什么operator, search, canvas+一堆其他的 extension, 但是这些功能有没有用和LLM 模型能力直接挂钩, LLM 模型好用了, 其他 extensions 开发出来都是很短时间的事情, 比起核心的模型优化和开发门槛并不高, 而且 deepseek 目前来看并不会参与 extension 的开发, 不会搞出个类似 GPTs store 这种不务正业的东西, 他们只需要搞模型, 要搞应用其他 startup 可以自己部署本地模型, 自己蒸馏, 自己搞, 或者用 deepseek 的便宜 API.
有专业的AI领域工程师定义专门的 AI benchmark task 用来给全世界所有新的 LLM 模型测试性能, deepseek R1 和 chatgpt O1 就是目前世界上最强大的 LLM 模型, 其他的什么 4O 根本不够看. 目前除了 R1 和 O1, O3 mini, 没有其他模型能展现同等级别的 chain of thought 能力, 也就是输入 prompt 后 deepseek 展示的思考过程, 而这个能力是目前 LLM 模型最先进的能力.

我最近几天在德国玩, DeepSeek工作一直不但正常而且很快，是美国几大公司甚至CIA暗自启动了对美国屁民的防火墙吗？

strawberrymm

7 个月

外行人请教一下：有了DS,我是不是可以不花20刀了？