Gpt 4一出,谁与争锋

w
wahhhaha
楼主 (北美华人网)
厉害啦……
我很好奇gpt-3.5怎么在sat数学拿到590/800的。。。它连小学简单的加减乘除都会做错。
h
honeybunch
这种测试knowledge型不是很好的比较baseline。我觉得一些没有正确答案的才是比较好的衡量标准。我前两天问一个问题:对于一个situation,what are the best options。结果ChatGPT写不出来,卡住了。ChatGPT现在对我就是一个summary tool,还是不能够和人竞争。
s
shanggj
我很好奇gpt-3.5怎么在sat数学拿到590/800的。。。它连小学简单的加减乘除都会做错。
睿 发表于 2023-03-14 16:01

AP Calculus 能拿 4, 为什么 SAT 才 700?
s
shanggj
这种测试knowledge型不是很好的比较baseline。我觉得一些没有正确答案的才是比较好的衡量标准。我前两天问一个问题:对于一个situation,what are the best options。结果ChatGPT写不出来,卡住了。ChatGPT现在对我就是一个summary tool,还是不能够和人竞争。
honeybunch 发表于 2023-03-14 16:11

现在也就能拿没有正确答案的 来显示优越感了。
f
fridec2
我很好奇gpt-3.5怎么在sat数学拿到590/800的。。。它连小学简单的加减乘除都会做错。
睿 发表于 2023-03-14 16:01

对每个domain,先要输入一段 咒语,比如网上找了几个:
(1) mathematician:
I want you to act like a mathematician. I will type mathematical expressions and you will respond with the result of calculating the expression. I want you to answer only with the final amount and nothing else. Do not write explanations. When I need to tell you something in English, I’ll do it by putting the text inside square brackets {like this}.
(2) math teacher:
I want you to act as a math teacher. I will provide some mathematical equations or concepts, and it will be your job to explain them in easy-to-understand terms. This could include providing step-by-step instructions for solving a problem, demonstrating various techniques with visuals or suggesting online resources for further study. My first request is "I need help understanding how probability works.
M
MMmm
看demo可以用来报税了
d
daapple
回复 1楼wahhhaha的帖子
还是上不了T14法学院
w
wahhhaha
看demo可以用来报税了
MMmm 发表于 2023-03-14 16:55

这些都是小活。但做错了不负责 哈哈
我看了一下对gpt4更加详细的报道,感觉数学这一块是快给攻克了。之前的3.0版本的确不行。不过这个进步的速度,逻辑方面有大大的提升。gpt5应该就非常非常强了。看来AI时代的确到来了。机器人和人类无妨碍对话,建议和咨询已经在我们的面前了。
马公的几万行code不敢保证gpt4能找bug或者改code。不过下几代的确没有这个问题了。包括很多行业,人工智能会辅助人类一起工作了。
实在不敢相信来的那么快,人工智能会慢慢的充斥在世界的各个角落。
s
shanggj
我看了一下对gpt4更加详细的报道,感觉数学这一块是快给攻克了。之前的3.0版本的确不行。不过这个进步的速度,逻辑方面有大大的提升。gpt5应该就非常非常强了。看来AI时代的确到来了。机器人和人类无妨碍对话,建议和咨询已经在我们的面前了。
实在不敢相信来的那么快,人工智能会慢慢的充斥在世界的各个角落。
睿 发表于 2023-03-14 23:46

进步速度太快了。前几天还跟女儿说 大学认真学点 AI 的东西 赶上这波革命。现在看 当心还没上完大学 革命就结束了
o
orientexpress
就按两年一代的速度,现在说AI不行的方面,下一代也许就全面超越了。 回顾一下AlphaGo, 刚出来还要人类棋谱来“喂”,下一代就完全脱离人类经验数据,从零开始自学习。