还以为deepseek和chatgpt不一样了

s
santamika
楼主 (北美华人网)
闻deepseek一个行业内的问题,结果还是一本正经的胡说八道,和chatgpt一个德行。
我就问了我们公司生产的一个产品,市场上有哪些技术,有何利弊,未来可能有什么技术更好。结果伊连市场上有什么技术都说不清/说错了。谈到未来的时候更是一塌糊涂。
栀子开门
闻deepseek一个行业内的问题,结果还是一本正经的胡说八道,和chatgpt一个德行。
我就问了我们公司生产的一个产品,市场上有哪些技术,有何利弊,未来可能有什么技术更好。结果伊连市场上有什么技术都说不清/说错了。谈到未来的时候更是一塌糊涂。
santamika 发表于 2025-01-27 17:57

我昨天试了一道证明题,和你得到同样结论。说出来被人攻击了。
它貌似一个powerful searching machine,但尚不能自己做推理。
S
Silverwing
人家的卖点本来就不是“比GPT”强 它们的卖点有2: 花费资源少&开放 你喷都没喷到点子上
s
santamika
Silverwing 发表于 2025-01-27 18:06
人家的卖点本来就不是“比GPT”强 它们的卖点有2: 花费资源少&开放 你喷都没喷到点子上

不能吃的烂苹果,再便宜你会买吗?
n
nickbear
deepseek的模型本来就是基于开源模型架构的,技术含量在于算法提高了训练效率和对数据的要求,不是说性能明显超越openai的模型了 就好比研究出了一个炼铁的流程,可以更快更省电的生产菜刀,不需要专业高炉自家小炉子也可以产,效果和工厂产的刀差不多 然后你拿这菜刀砍石头说还是砍不动,没区别 但是这个技术以后也可以用来做大锤做斧头
y
yanhren
哈,楼主你没看出来这论坛的结论已定deepseek脚踢chatgpt,拳打ilama,美国股市吓得瑟瑟发抖,已经要崩盘啦!
5
50cents
哈哈哈哈哈哈,大妈们啥也不懂。。。它的恐怖之处就是一样啊。。。。
h
helloterran4
santamika 发表于 2025-01-27 17:57
闻deepseek一个行业内的问题,结果还是一本正经的胡说八道,和chatgpt一个德行。
我就问了我们公司生产的一个产品,市场上有哪些技术,有何利弊,未来可能有什么技术更好。结果伊连市场上有什么技术都说不清/说错了。谈到未来的时候更是一塌糊涂。

每隔几个小时就出了一个把大模型当成搜索引擎用的天才。
这么大的漏洞,设计benchmark的人没想到,几千个业内人员没发现。一下子就被你逮到了
有没有考虑过是你自己一窍不通呢?
s
shanggj
栀子开门 发表于 2025-01-27 18:04
我昨天试了一道证明题,和你得到同样结论。说出来被人攻击了。
它貌似一个powerful searching machine,但尚不能自己做推理。

什么题?
N
Namama
santamika 发表于 2025-01-27 17:57
闻deepseek一个行业内的问题,结果还是一本正经的胡说八道,和chatgpt一个德行。
我就问了我们公司生产的一个产品,市场上有哪些技术,有何利弊,未来可能有什么技术更好。结果伊连市场上有什么技术都说不清/说错了。谈到未来的时候更是一塌糊涂。

Deepseek本来就没说自己和chatGPT不一样啊。。
而是DS达到了chatGPT一样的能力水平,但成本只有一个零头。。

m
mermaidyuu
帮我问问零下25华氏和摄氏哪个更冷吧?
s
shushan
Silverwing 发表于 2025-01-27 18:06
人家的卖点本来就不是“比GPT”强 它们的卖点有2: 花费资源少&开放 你喷都没喷到点子上



作为一个用户,我感觉到一个差别就是在DeepSeek的deep think和search都开启时,它回答问题会把回答问题时的思考、推理、筛选过程,以及所找的网络依据的链接都列上,这样我们可以进一步阅读和校验。
这是chatgpt一直没有做到的痛点
h
helloterran4
nickbear 发表于 2025-01-27 18:10
deepseek的模型本来就是基于开源模型架构的,技术含量在于算法提高了训练效率和对数据的要求,不是说性能明显超越openai的模型了 就好比研究出了一个炼铁的流程,可以更快更省电的生产菜刀,不需要专业高炉自家小炉子也可以产,效果和工厂产的刀差不多 然后你拿这菜刀砍石头说还是砍不动,没区别 但是这个技术以后也可以用来做大锤做斧头

R1模型时目前最好的推理模型之一。不仅如此,它还把推理过程完全公开。这就是最大的优势。
剩下的让R1自己来回答吧
q
qtanmonster
Gpt 和deepseek都是transformer的模型,肯定还有hallucination啊,这是AI不可绕过的一点,但是ds能给出推理步骤就是进步了
p
page394
我看买提上问DS 今天股市崩盘股票和它有没有关系,答得不着边际。gpt 说的有逻辑多了。
y
youshuishini
santamika 发表于 2025-01-27 17:57
闻deepseek一个行业内的问题,结果还是一本正经的胡说八道,和chatgpt一个德行。
我就问了我们公司生产的一个产品,市场上有哪些技术,有何利弊,未来可能有什么技术更好。结果伊连市场上有什么技术都说不清/说错了。谈到未来的时候更是一塌糊涂。

听分析说目前主要是成本巨低。 未来还要看其发展到如何的程度。
s
shushan
回复 13楼 helloterran4 的帖子

对,除了推理过程,还有其推理筛选中,如果是从网上找的每一步的数据来源的依据的URL。这对business应该很重要,可以校验其准确性。
h
helloterran4


作为一个用户,我感觉到一个差别就是在DeepSeek的deep think和search都开启时,它回答问题会把回答问题时的思考、推理、筛选过程,以及所找的网络依据的链接都列上,这样我们可以进一步阅读和校验。
这是chatgpt一直没有做到的痛点
shushan 发表于 2025-01-27 18:17

很可能OpenAI也发现了纯粹用RL大力出奇迹,奖励最终的推理结果,就能让大模型自己演化出推理能力。
但是他们比较自私一点。
OpenAI 威胁用户撤销 o1 访问权,仅仅因为询问了 o1 思维链原理! https://www.infoq.cn/article/IY4OecDiTIruXFTsDU8R

R1模型自己的解释:
l
lendingclubs
哈,楼主你没看出来这论坛的结论已定deepseek脚踢chatgpt,拳打ilama,美国股市吓得瑟瑟发抖,已经要崩盘啦!
yanhren 发表于 2025-01-27 18:10

事实胜于雄辩,美股不是要崩盘,而是已经崩盘,NVDA一天损失近6000亿,美股史上最高,你以为在逗你玩? 真没事谁会花6000亿逗你开心
O
Octavian1223
开源而且省资源,就相当于unix, startup拿去训练修改一下,早晚会诞生Linux Android.
y
yanhren
回复 19楼 lendingclubs 的帖子
哇,这就叫崩盘啦?你去看看盘后吧!
a
amyfair
DS确实会对大部分问题给出推理及其依据,但是根据我今天使用的结果看,对于比较深入的专业性强的问题DS基本上也是给出一些似是而非的依据然后胡说八道结论。不过用更少的资源作出不比ChatGPT逊色的产品还是很厉害的
l
lendingclubs
回复 21楼 yanhren 的帖子
Nvida 是华尔街美股历史上一天内最大的价值损失配不上崩盘两个字,那你觉得啥叫崩盘? 收盘跌了近17%,现在盘后反弹2.5%你觉得很牛?
S
Silverwing
哈哈哈哈哈哈,大妈们啥也不懂。。。它的恐怖之处就是一样啊。。。。
50cents 发表于 2025-01-27 18:12

对啊, 一句“都一样”能让奥特曼睡梦中惊醒
p
page394
lendingclubs 发表于 2025-01-27 18:23
事实胜于雄辩,美股不是要崩盘,而是已经崩盘,NVDA一天损失近6000亿,美股史上最高,你以为在逗你玩? 真没事谁会花6000亿逗你开心

说Nivea 你去买put 好了。 说美股看看道琼斯啊。
c
catgoose
回复 12楼 shushan 的帖子
chatgpt有网络链接的,在给你信息的最后,灰色的字体。你用的是低版本的。
y
yanhren
回复 23楼 lendingclubs 的帖子
美国股市没有涨跌幅限制,崩盘就17%为标准的话,A股万股跌停咋说呢?
l
lendingclubs
page394 发表于 2025-01-27 18:48
说Nivea 你去买put 好了。 说美股看看道琼斯啊。

你去买Call啊,事实说不过了就耍赖,无聊
d
dukenyc125
问deepseek任何关于中国的问题看看,结果很无语 这可能是将来中国AI最大的瓶颈
c
catgoose
回复 27楼 yanhren 的帖子
美股Dows 30有每天不能跌停7%的机制,否则就会休市。另外,A股跌停是一直跌停,和美股概念完全不一样。美股发展到现在,机制相对来说已经毕竟完善了。A股不能同日而语的,自己可以找找这些方面的资料。
l
lendingclubs
回复 23楼 lendingclubs 的帖子
美国股市没有涨跌幅限制,崩盘就17%为标准的话,A股万股跌停咋说呢?
yanhren 发表于 2025-01-27 18:49

CNBC标题
Nvidia sheds almost $600 billion in market cap, biggest one-day loss in U.S. history
跟A股有屁关系,我说A股了吗
c
catgoose
回复 23楼 lendingclubs 的帖子
个股跌17%还真不能叫做崩盘,最多叫做震荡。美股不是这么统计的。我买过的美股一天可以跌个60%这样的,这个是很正常的。
j
joyce612
deepseek不会回答的问题会告诉你 他目前还没有足够的信息回答这个问题 ChatGPT会告诉你一大篇它编好的答案,连名字都可以给你胡编乱造出一个从来没有过的人物.
t
thyx
shushan 发表于 2025-01-27 18:17


作为一个用户,我感觉到一个差别就是在DeepSeek的deep think和search都开启时,它回答问题会把回答问题时的思考、推理、筛选过程,以及所找的网络依据的链接都列上,这样我们可以进一步阅读和校验。
这是chatgpt一直没有做到的痛点

mark
S
Sparky08
回复 4楼 santamika 的帖子
你自己不说一样吗,这不是一样的苹果,一个一百,一个十元,你交智商税只买贵的?
W
WIBB
我今天试了10个同样的问题,有五个回答Deepseek 比GPT 好,化学方面的
n
nickbear


作为一个用户,我感觉到一个差别就是在DeepSeek的deep think和search都开启时,它回答问题会把回答问题时的思考、推理、筛选过程,以及所找的网络依据的链接都列上,这样我们可以进一步阅读和校验。
这是chatgpt一直没有做到的痛点
shushan 发表于 2025-01-27 18:17

o1其实有过类似功能,对reasoning过程列提纲,但是现在的版本弱化了,只有简单过程
i
imniz
它是1分价格做出了8分产品,静待市场检验这个1 & 8
B
Bloomwood
dukenyc125 发表于 2025-01-27 18:52
问deepseek任何关于中国的问题看看,结果很无语 这可能是将来中国AI最大的瓶颈

为什么非要问和政治有关的东西?你自己已经有想法,或者对发生的事情不知道的话可以Google。非要让AI给你个想法?
p
page394
yanhren 发表于 2025-01-27 18:49
回复 23楼 lendingclubs 的帖子
美国股市没有涨跌幅限制,崩盘就17%为标准的话,A股万股跌停咋说呢?

美股大盘道琼斯今天涨了啊。崩盘在哪里。
s
shanggj
mermaidyuu 发表于 2025-01-27 18:15
帮我问问零下25华氏和摄氏哪个更冷吧?

前几天就有人举这个例子。但 chatgpt 和 deepseek 都回答的很正确呀。
s
shanggj
joyce612 发表于 2025-01-27 18:58
deepseek不会回答的问题会告诉你 他目前还没有足够的信息回答这个问题 ChatGPT会告诉你一大篇它编好的答案,连名字都可以给你胡编乱造出一个从来没有过的人物.

比如说什么问题?
m
mylifetouch
Silverwing 发表于 2025-01-27 18:06
人家的卖点本来就不是“比GPT”强 它们的卖点有2: 花费资源少&开放 你喷都没喷到点子上

"花费资源少&开放" 的llm多了去了。DeepSeek的卖点就是宣称比openAI最新的model还厉害。你就别洗了。

y
yanhren
lendingclubs 发表于 2025-01-27 18:54
CNBC标题
Nvidia sheds almost $600 billion in market cap, biggest one-day loss in U.S. history
跟A股有屁关系,我说A股了吗

最大损失的一天,就是崩盘?原来在你的概念里,这两个是一个意思呀!

j
jbea
其实就是福建人开餐馆的路子.
j
jbea
什么时候自己开创一个
m
meftw
栀子开门 发表于 2025-01-27 18:04
我昨天试了一道证明题,和你得到同样结论。说出来被人攻击了。
它貌似一个powerful searching machine,但尚不能自己做推理。

能自己推理那是AGI了。基于机器学习方法的AI我认为不可能做到AGI,不过也没所谓,反正是用最少的资源做到目前最好的水平,还是开源,这就够把美国一批公司赶入绝路了
D
Dingmoren2
yanhren 发表于 2025-01-27 18:10
哈,楼主你没看出来这论坛的结论已定deepseek脚踢chatgpt,拳打ilama,美国股市吓得瑟瑟发抖,已经要崩盘啦!

美国股市吓得瑟瑟发抖不是事实吗?如果ChatGPT ,ilama没有抢回技术领先结局就是死。原来卖1万美元的电脑,现在有一个价格500美元性能相同的电脑。卖一万的还有活路吗?
x
xiaoyaoguai777
dukenyc125 发表于 2025-01-27 18:52
问deepseek任何关于中国的问题看看,结果很无语 这可能是将来中国AI最大的瓶颈

也不一定。 最后怎么生产产品和GPD和政治本身关系不大。 就像,挂在嘴边的god bless america并不会影响软件外包诸如此类

N
Northeastian
dukenyc125 发表于 2025-01-27 18:52
问deepseek任何关于中国的问题看看,结果很无语 这可能是将来中国AI最大的瓶颈

这种盲点都有的,有些问题,比如加萨问题,问GPT也一样。 数据是feed的,不是自查的。
s
shubashuba
刚问了问关于一个演员的问题,deepseek给人家按了个不同的姓,chatgpt给人换了个学校,都是睁眼瞎说,哈哈哈
y
yanhren
回复 48楼 Dingmoren2 的帖子
你不炒股吧?美国股市主板是指道琼斯,基本持平;纳斯达克是创业股,也就跌了3%,这就崩盘啦?这就瑟瑟发抖啦?只有部分ai科技股受到了影响,也不是全部apple,meta都没跌,咋就能称之为崩盘呢?
后续会怎样,现在尚不知道,至少盘后英伟达又部分回调了。单股也没崩盘,无非是一个大跌而已,哪家股票没有几个连续的下跌板?都正常现象。



M
MajiaZ
栀子开门 发表于 2025-01-27 18:04
我昨天试了一道证明题,和你得到同样结论。说出来被人攻击了。
它貌似一个powerful searching machine,但尚不能自己做推理。

我问的一个数学题,两个都给了错的答案。我说,错了,重新做。第二次做对了。然后问了是不是确定这次正确?再重新算,又给了第一次的答案!骂了一下,要求再重新算,又给了第二次的正确答案。态度都是很好。哈哈哈
s
shanggj
MajiaZ 发表于 2025-01-27 21:57
我问的一个数学题,两个都给了错的答案。我说,错了,重新做。第二次做对了。然后问了是不是确定这次正确?再重新算,又给了第一次的答案!骂了一下,要求再重新算,又给了第二次的正确答案。态度都是很好。哈哈哈

什么题?
l
layjohns
MajiaZ 发表于 2025-01-27 21:57
我问的一个数学题,两个都给了错的答案。我说,错了,重新做。第二次做对了。然后问了是不是确定这次正确?再重新算,又给了第一次的答案!骂了一下,要求再重新算,又给了第二次的正确答案。态度都是很好。哈哈哈

有一说一,对于大语言模型,数学解答不是他们擅长的东西,无论deepseek还是chatgpt
D
Dingmoren2
近20年,某个产业中国技术拉平了,假以时日就会把市场占领。除非mata的马公也拿出996的干劲。
p
pangapang
chatgpt 又不对中国人服务,刚上市的时候时而有亲戚借手机号注册的大坑 连带一通批判没边界感脸好大衍生品 国人自己做一个多好的事情
l
layjohns
deepseek不说别的,因为chatgpt本来就对中国封锁,所以deepseek占领大陆市场没问题了
M
MajiaZ
shanggj 发表于 2025-01-27 21:58
什么题?

一个极其简单的题,最后一步是一元方程式,两个都算错。哈哈哈
s
shanggj
MajiaZ 发表于 2025-01-27 22:07
一个极其简单的题,最后一步是一元方程式,两个都算错。哈哈哈

什么题?
D
Dingmoren2
yanhren 发表于 2025-01-27 21:51
回复 48楼 Dingmoren2 的帖子
你不炒股吧?美国股市主板是指道琼斯,基本持平;纳斯达克是创业股,也就跌了3%,这就崩盘啦?这就瑟瑟发抖啦?只有部分ai科技股受到了影响,也不是全部apple,meta都没跌,咋就能称之为崩盘呢?
后续会怎样,现在尚不知道,至少盘后英伟达又部分回调了。单股也没崩盘,无非是一个大跌而已,哪家股票没有几个连续的下跌板?都正常现象。




A I公司的老板,华尔街的大佬们估计已经瑟瑟发抖了。当然他们需要逃顶,发抖了也不能让普通股民知道。以前这些公司更新一版涨一波。现在更新一版也许下跌一波。没有996的干劲,怎么追得上人家的迭代。如果你看好,希望你趁低杀入。
y
yanhren
回复 61楼 Dingmoren2 的帖子
失敬失敬,原来你不是普通股民,都能知道华尔街大佬瑟瑟发抖这种一般普通股民不能知道的内幕信息呀!
那你继续看跌,躺着发财吧!
O
OroMedonte
我平常用GEMINI也比较了以下。AI门外汉仅从使用者角度比较。
但就文字问题,GEMINI答的方方面面稍微全一些,Deepseek 也不错。GEMINI直接给答案秒回复。DS 答复一条条显示挺有意思的,尤其数学题有解题思路。
GEMINI可以生成图像,总结Youtube视频等,DS目前做不到。GEMINI没有什么禁区,天南海北随便问。DS有些敏感区域。
m
mermaidyuu
shanggj 发表于 2025-01-27 20:46
前几天就有人举这个例子。但 chatgpt 和 deepseek 都回答的很正确呀。

Chatgpt 回答得非常有理有据的不正确啊
平明寻白羽
栀子开门 发表于 2025-01-27 18:04
我昨天试了一道证明题,和你得到同样结论。说出来被人攻击了。
它貌似一个powerful searching machine,但尚不能自己做推理。

搞错了
R1的革命性就在于reinformed learning赋予了AI自我推理自我学习自我进化的能力。一个全新的milestone, 也许已经是幼儿期的AGI了。
给他一个任务,他自己去想各种办法去解决。现在还是通用性推理AI。
特别专业domain的问题,可以通过focused training来让他成为这个领域的专职agent。
这是R1为什么影响力这么巨大的原因。
小青龙
回复 12楼 shushan 的帖子
我开了deep think之后,只觉得这些“心路历程”就像打开一个网页后满面的平行罗列,没有重点。可能train多了会“聪明”一点。
t
tiantiana
shushan 发表于 2025-01-27 18:17


作为一个用户,我感觉到一个差别就是在DeepSeek的deep think和search都开启时,它回答问题会把回答问题时的思考、推理、筛选过程,以及所找的网络依据的链接都列上,这样我们可以进一步阅读和校验。
这是chatgpt一直没有做到的痛点


completely agree
h
helloterran4
平明寻白羽 发表于 2025-01-27 23:54
搞错了
R1的革命性就在于reinformed learning赋予了AI自我推理自我学习自我进化的能力。一个全新的milestone, 也许已经是幼儿期的AGI了。
给他一个任务,他自己去想各种办法去解决。现在还是通用性推理AI。
特别专业domain的问题,可以通过focused training来让他成为这个领域的专职agent。
这是R1为什么影响力这么巨大的原因。

r1已经摸到了bootstrap的门槛。一个能自己推理,自己演进,自发产生逻辑能力的模型。只要走出这第一步,剩下的都只是时间问题。
openai雇了海量博士生做数据标注。deepseek完全用模型本身来评价模型自己。
deepseek zero的地位,就相当于从零起步的alphazero模型,完全不看人类棋谱,却在自我对弈中掌握了围棋的精华。
alphazero是大模型在围棋领域碾压所有人类
deepseek r1是大模型在99%的领域超过99%的人类。
w
wormcc
yanhren 发表于 2025-01-27 18:10
哈,楼主你没看出来这论坛的结论已定deepseek脚踢chatgpt,拳打ilama,美国股市吓得瑟瑟发抖,已经要崩盘啦!

ilama是什么鬼,是llama
h
hoxu
OroMedonte 发表于 2025-01-27 22:37
我平常用GEMINI也比较了以下。AI门外汉仅从使用者角度比较。
但就文字问题,GEMINI答的方方面面稍微全一些,Deepseek 也不错。GEMINI直接给答案秒回复。DS 答复一条条显示挺有意思的,尤其数学题有解题思路。
GEMINI可以生成图像,总结Youtube视频等,DS目前做不到。GEMINI没有什么禁区,天南海北随便问。DS有些敏感区域。

你用的Gemini 收费的吗?怎么我的 Gemini 傻x到不行。啥都是不能说,不知道。2*3 还要解释步骤,结果只有一步。
d
dkTW
回复 61楼 Dingmoren2 的帖子
花街的空跟多對它們有什麽差別 空跌的快又多 賺得快與多 反手再做多 不是最好來回贏兩次 割兩次韮菜 爲什麽對他們有那麽多想法與期待呢 不就是賺錢為大 有大波動才好嗎
h
helloterran4
wormcc 发表于 2025-01-28 05:53
ilama是什么鬼,是llama

川粉高华大妈出于对美国深沉的爱,出来踩一脚中国ai ,捧一捧美国ai呗
虽然她连美国ai模型的名字都不知道,以为llama第一个字母是大写I呢
h
happyberry
shushan 发表于 2025-01-27 18:17


作为一个用户,我感觉到一个差别就是在DeepSeek的deep think和search都开启时,它回答问题会把回答问题时的思考、推理、筛选过程,以及所找的网络依据的链接都列上,这样我们可以进一步阅读和校验。
这是chatgpt一直没有做到的痛点

是的,我也很喜欢这点,以后小孩学习都可以问deep seek了,直接解释得清清楚楚。有过程,有source
s
shanggj
mermaidyuu 发表于 2025-01-27 23:13
Chatgpt 回答得非常有理有据的不正确啊

j
jianliu67
shushan 发表于 2025-01-27 18:17


作为一个用户,我感觉到一个差别就是在DeepSeek的deep think和search都开启时,它回答问题会把回答问题时的思考、推理、筛选过程,以及所找的网络依据的链接都列上,这样我们可以进一步阅读和校验。
这是chatgpt一直没有做到的痛点

ChatGPT 不是没做到,而是不显示过程。
O
OroMedonte
hoxu 发表于 2025-01-28 06:12
你用的Gemini 收费的吗?怎么我的 Gemini 傻x到不行。啥都是不能说,不知道。2*3 还要解释步骤,结果只有一步。

是 pixel 9 pro 自带的 Gemini 1.0 Pro version,不收费。
目前喜欢DS多些了,有些基本的智力。问了How many R in stawberry 故意漏了个R,高下立见。
m
mermaidyuu
shanggj 发表于 2025-01-28 12:59

所以,你没看出有问题? 那应该查查眼睛,或者脑子。
i
iamcs1983
yanhren 发表于 2025-01-27 18:10
哈,楼主你没看出来这论坛的结论已定deepseek脚踢chatgpt,拳打ilama,美国股市吓得瑟瑟发抖,已经要崩盘啦!

何止这些,很多人都说美国烂到根子里马上要亡国了。