DeepSeek R1推理功夫了得!

s
slow_quick
楼主 (文学城)

注意,要点一下左下角的 DeepThink (R1) 。

我问了这个经典问题:

Say there are more than one finite number of points on a Euclidean plane, and they are not falling on a single straight line.  Proof that there exists a straight line that goes through only two of those finite points.

它洋洋洒洒考虑了好几分钟,写了好几段怎么思考,最后居然证明了!

 

s
slow_quick
我完全不懂AI,就觉得都很神奇
s
slow_quick
问ChatGPT同一问题,解答快得多也简洁许多。目前DeepSeek还嫩了点
s
slow_quick
我仔细阅读了一下,ChatGPT的证明不完全,差评

s
slow_quick
DeepSeek R1 虽然啰嗦了点,却是正确的证明!
p
pichawxc
ChatGPT4 推理一般,o1应该没有问题,AIME考试能到83分。
玻璃坊
R1深度思考和推理,所以慢一些
未知
把你的问题Post到 https://lmarena.ai/, 看看哪个模型的回答更好?

https://lmarena.ai/

 

s
slow_quick
再仔细阅读一下,Deepseek 也错了,但更接近
s
slow_quick
明天空了贴上来大家评论
颜阳
昨天问了DS几个电子通讯的数学问题,一个也没答出来。问它怎么在噪音中读取抗干扰平谱信号,它BS了半天貌似懂连概念都错了

我觉得DS OR CHATGPT就像个百事通牛逼大王似乎什么都懂,问深一点就什么也不懂了。就像有些人履历牛逼很大,面试时空洞地泛泛而谈,洋相出尽一样。不过我还是期望技术继续突破最终胜过人的水平。

s
slow_quick
我的观察:目前所有AI都是学会了说人话,学术问题绝对可以唬唬外行,但内行一看就不对
上海大男人
一分钱一分货,历来如此。驱良币会发生,更精确讲是成本下降。
拍浪
同样的问题,chatgpt 回答的如何?
s
slow_quick
我昨天是在tablet app上问DS R1,今天换到电脑上browser问同一个问题,它完全错了

数学逻辑思维似乎靠蒙

我没有付费的ChatGPT,我同事把这个问题提交给ChatGPT o1,也不行,错得离谱。

颜阳
似乎比DS差。DS还会BS一下通用理论,CHATGPT好像乱说的连边都答不上。
拍浪
很好的体验,多谢回复。
s
slow_quick
ChatGPT o1也错得离谱