用chatGPT解数学竞赛题,很逗

j
jzbao
楼主 (北美华人网)
娃正参加Beestar的网上数学竞赛,第二轮有几道题挺难,我看了也不确定,索性下来用正时髦的chatGPT试试,结果让我大开眼界,chatGPT几秒钟解五年级竞赛难题, 并且给出详细推理过程。但chatGPT也在简单的分数计算出错,莫名其妙。。 分享一下:   题目: Box A contains 5 red balls and 7 green balls. Box B contains 3 red balls and 2 green balls. A box is chosen at random, and one ball removed at random from this box. Given that the ball removed was green, what is the probability that it came from box A?
这题目谁碰上都得仔细想想。 输入chatGPT, 几秒钟给出超详细的解题过程:
Let's use Bayes' theorem to solve this problem: Let A be the event that the ball was drawn from box A, and G be the event that a green ball was drawn. We want to find P(A|G), the probability that the ball came from box A given that it was green. By Bayes' theorem: P(A|G) = P(G|A)P(A) / P(G) where: P(G|A) is the probability of drawing a green ball given that the box is A. This is 7/12 since box A has 7 green balls out of 12 total balls. P(A) is the prior probability of choosing box A, which is 1/2 since either box could have been chosen at random. P(G) is the total probability of drawing a green ball, which can be calculated using the law of total probability: P(G) = P(G|A)P(A) + P(G|B)P(B) where P(G|B) is the probability of drawing a green ball given that the box is B, and P(B) is the prior probability of choosing box B, which is also 1/2.   We can calculate P(G|B) as 2/5 since box B has 2 green balls out of 5 total balls. Plugging these values into Bayes' theorem, we get:   P(A|G) = (7/12) * (1/2) / [(7/12)(1/2) + (2/5)(1/2)] ≈ 0.636   Therefore, the probability that the ball came from box A given that it was green is approximately 0.636 or 63.6%.   太厉害了!chatGPT 真吓我一跳。但当我拿着结果在Beestar却找不到正确的选则答案。后来知道chatGTP竟把自己给出的简单计算算错了,(7/12) * (1/2) / [(7/12)(1/2) + (2/5)(1/2)] = 35/59 ≈ 0.593, 不是0.636。 难解题思路它都对了,简单计算却错了,让我无语,真逗!搞AI的大牛们解释一下,是不是AI 分数计算能力有点弱?
s
shanggj
回复 1楼jzbao的帖子
你用的旧版本吧, 听说新的 4.0 没有这种问题了。 
j
jzbao
今天刚用,应该是 GPT4.0
n
nickbear
今天刚用,应该是 GPT4.0
jzbao 发表于 2023-03-17 18:09

你用的肯定不是4.0,还没有开放公测 chatGPT回答质量取决于类似的题目在网上有没有答案
s
shanggj
你用的肯定不是4.0,还没有开放公测 chatGPT回答质量取决于类似的题目在网上有没有答案
nickbear 发表于 2023-03-17 18:12

chatGPT plus user 不是说都可以 access 4.0 吗?
P
Parlindome
语言模型不是计算器,数值计算肯定是不行的。但它是会用计算器的,目测很快就加入模型自己用计算器的功能。
p
page394
今天刚用,应该是 GPT4.0
jzbao 发表于 2023-03-17 18:09

交钱没有,没交钱就是旧的
B
BeHappy78
你用的肯定不是4.0,还没有开放公测 chatGPT回答质量取决于类似的题目在网上有没有答案
nickbear 发表于 2023-03-17 18:12

我也觉得是, 说chatGPT 面试编程的, 这题目和都在Leetcode或者类似网站上,当然答得好呀
n
netghost
不是AI變聰明了,是人變傻了,不google自己不會出題的。
美颜盛世
让它做mathcounts里面的稍微难一些的题,没有一道题能做对。
而且告诉它做错了,原因是什么,它说你说的对,然后再胡乱解释一遍,再算一遍,还是错的。再次纠正,然后它叭叭叭的推理计算,还是错的,基本就是一本正经的胡说八道
s
shanggj
让它做mathcounts里面的稍微难一些的题,没有一道题能做对。
而且告诉它做错了,原因是什么,它说你说的对,然后再胡乱解释一遍,再算一遍,还是错的。再次纠正,然后它叭叭叭的推理计算,还是错的,基本就是一本正经的胡说八道
美颜盛世 发表于 2023-03-17 21:12

同样的题 网上大妈们 有几个能做对的
a
aiyamayayongle
回复 11楼shanggj的帖子
且不论网上大妈是不是做不对,网上大妈的表现和狗屁通的表现有什么关系么。
f
facet
目前为止的语言模型所生成的计算过程,表面上是算式,实际上来自于字符串的关联和采样,比如四则运算符号+ -*/ 甚至🟰,它们都完全没有数学意义,不是按照严格计算来进行的
j
jzbao
用了多个题目后,我觉得GPT不是简单地查找解题答案,它是推理解的,步骤很清晰,尽管有些做错了,它是试图推理的
d
dancingpig2019
昨天测的GBT-4, 中学的数学竞赛题做起来没任何问题。到大学的数学竞赛题才开始有做不出来的。
g
gaosu
“昨天测的GBT-4, 中学的数学竞赛题做起来没任何问题。“
那太好了, 照这个发展速度上学苦读就没有必要了,问题都可以让GPT来解,以后学校教育得有天翻地覆的变化
s
shanggj
昨天测的GBT-4, 中学的数学竞赛题做起来没任何问题。到大学的数学竞赛题才开始有做不出来的。
dancingpig2019 发表于 2023-03-18 16:09

能做几何题了?
f
fogger
昨天测的GBT-4, 中学的数学竞赛题做起来没任何问题。到大学的数学竞赛题才开始有做不出来的。
dancingpig2019 发表于 2023-03-18 16:09

那它AMC10的分数为什么那么低