ChatGPT有物理学博士水平?我们的测试结果令人… - 2023年2月14日 / 头条新闻

2 年多前

大家最近肯定被ChatGPT刷屏了，好像它神通广大，无所不能...

但，无所谓，物理学会出手。今天就让我们来测测它物理知识的素养吧！

ChatGPT的介绍

ChatGPT (全称:Chat Generative Pre-trained Transformer ) 是由OpenAI开发的一个人工智能聊天机器人程序，于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。

ChatGPT目前仍以文字方式互动，而除了可以通过人类自然对话方式进行交互，还可以用于相对复杂的语言工作，包括自动文本生成、自动问答、自动摘要等在内的多种任务。如：在自动文本生成方面，ChatGPT可以根据输入的文本自动生成类似的文本（剧本、歌曲、企划等），在自动问答方面，ChatGPT可以根据输入的问题自动生成答案。还具有编写和调试计算机程序的能力。

ChatGPT图

哎，让它自己做个自我介绍。

那么，简单的介绍做完了，那么就正式进入到我们的物理考试时间吧。

物理知识考核

咱们从简单到复杂，慢慢的测试它~

初中物理知识：

刚开始就错了，看来ChatGPT也不行啊（

，正确答案应该是：大小，方向和作用点。让我们继续。

这个回答差强人意，不过这两个问题说明，它的初中知识储备还可以。那么知识的使用能力呢?

一个选择问题和一个计算问题也算是回答上来了。看来初中的知识难不倒它。

高中物理知识：

升级难度，那么现在就进入高中知识阶段。

还是先试一试它的基础知识储备，可以这没问题。但到了高中，公式推导能力就应该提高了,看看它行不行。

再看看它的回答。

只能说还是不尽人意（忽略小编因为马虎而造成的错别字），它最后没有回答正确。

正确答案应该是：

再来看看它的电磁学知识。

继续问问它。

再追问一下。

还行，看来它还是有点逻辑思维。

那么就继续上强度吧！

大学物理知识：

对于物理专业的课程大家可能不是很了解，但肯定都有所耳闻。那小编就给大家稍微总结介绍一下一名物理专业的大学生要学习什么物理专业课程~

力学，光学，电磁学，热学：这四门课程也叫做“普通物理学”，俗称普物，这四门课程是承接高中初中所学的知识进行一定的扩展，相当于入门知识。

四大力学（可不是四种力学）：理论力学，电动力学，量子力学以及统计力学。这四门课程对于物理学专业的本科生可谓是重中之重，借用我老师的一句“玩笑话”：如果一个搞物理的人不能搞清楚四大力学，那么就不要说自己是搞物理的了。

四大力学教学书

其实这里还有一个很特殊的课程：原子物理。它就像是承接普物与四大力学之间的桥梁，所以在大学课程中一直保留着。

再后面就会根据你的研究方向和兴趣来针对学习，比如：凝聚态专业就会选择固体物理和半导体物理等...

好的废话说完了，进入主题。

哈哈哈，失败，它应该是不知道拉格朗日方程的物理含义。你也忘了？来看看这个：掌控所有运动规律的原理：最小作用量原理。（看完你就比Chat GPT强了），继续。

咱们转换一下。

嗯，写的代码是正确的，算它知道。

emmm，格式不太对，但是它描述的还是比较准确的。正确答案应该是：

最后问他一个问题。

它写的是真空有源下的麦克斯韦方程组，没有问题。洛伦兹规范是电动力学中的经典问题，大家可以参考曹则贤老师的演讲：曹则贤 | 电磁学/电动力学：现象、技术与思想（下），小编就不在这里赘述了。

好吧，考试到此结束，小编对它的评价是：有点眼高手低，人云亦云。它因为庞大的数据集，物理知识储备是非常多的，远超一般人所能容纳的知识量，但是它的逻辑能力和辨别能力表现却没有那么完美。

“学习”能力考核

前面可以看到，虽然它的逻辑很差，但是知识水平不错，那么它的学习能力呢？我们来调戏测试一下。

好像它真的明白了，我们再换个人名问一下。

好像它明白了，但明白的不多，咱们换个数学题。

我们稍微把题目换一下。

小编崩溃它刚开始还是算错了~ 但是它还是很明白计算过程。总的来说，它有学习能力，但是目前来看不多。

注：小编的测试过程是连续的，在同一个窗口进行的。

小花絮

给它点个赞。

小编不说别的，你们应该懂了吧。快来！《科学公开课》缤纷世界主题课。

总结

不得不说，Chat GPT给我们带来了很大的惊喜：它确实能通过人类自然对话方式进行交互，并可以用于自动文本，代码生成等相对复杂的语言工作。但是它还是有很大的局限性，对于数学计算，脑筋急转弯等需要极强逻辑的领域，会频频犯错。并且它有时会一本正经的给出它所谓的正确答案，这对非专业领域的人非常难于辨别（你觉着它的薛定谔方程写的正确吗？），总之，目前的它是一个不错的工具，但是绝对不要过度依赖它！

金

金三

2 年多

1 楼

随地大小便的中国人酸呀。 [1评]

forun

2 年多

2 楼

Stuart Russell is professor of Neurological Surgery at the University of California, San Francisco and Professor of Computer Science at Berkeley. He is vice chair of the World Economic Forum’s Council on AI and Robotics. He is a fellow of the American Association for Artificial Intelligence. AI, Russell explain, cannot perform abstract reasoning. AI-machines such as IBM’s Watson, he explains, can extract simple information from clearly stated facts – “but cannot build complex knowledge structures from text; nor can they answer questions that require extensive chains of reasoning with information from multiple sources.” Or take Alpha Go – Google Deep Mind’s AI-system for playing the board game Go. “Alpha Go has no abstract plan. Trying to apply AlphaGo in the real world is like trying to write a novel by wondering whether the first letter should be an A, B, C, and so on.” This is a broad limitation. AI cannot find by itself ways to proceed from general rules to concrete actions, if there are no human-defined rules for this. Thus, AI basically lacks the capability to plan and perform actions. “At present”, Russell writes, “all existing methods for hierarchical planning rely on a human-generated hierarchy of abstract and concrete actions.” Computers that learn these hierarchies by themselves have not been invented so far. The reason: Human scientists “do not yet understand how such hierarchies can be learned [by an AI] from experience.” http://www.netopia.eu/abstract-intelligence-put-human-values-ai/

不

不渴而饮

2 年多

3 楼

这货再上几年学德行样就大了，那会儿真的可以问，元芳你咋看？

wass

2 年多

4 楼

小明18岁了，他10年前出生，请问小明现在几岁。智力正常的人会问这么傻逼的问题吗？

意

意见没

2 年多

5 楼

tnnd你现在在留园就是死猪不怕开水烫、破罐子破摔、我是流氓我怕谁🙄

XXyourOO

2 年多

6 楼

我出一道题考死ChatGPT：请问，中国共产党中央委员会总书记，中共中央军事委员会主席，中华人民共和国主席，中华人民共和国中央军事委员会主席习近平同志，什么时候换肩？

媚

媚眼瞟瞟

2 年多

7 楼

你们期望太高了。问一下妓院在哪，费用多少，保证从容应付，高度准确。

iota式

2 年多

8 楼

微软Bing新出的那个可以测测，感觉比ChatGPT要厉害啊

天

天罡

2 年多

9 楼

准备写篇文章，弄了十个要点做提纲设计实验，然后十个要点一个个输进去，全部是不可能。加了很多提示，让它自己找文献，它每个题目起码查出三篇文献，那么它自己找出的文献稍微变换一下就是，但是就是不会，看来只有知识，没有任何创新，而且连自己查到的文献都不会用。这是比较奇怪的。要是人，只要查到几篇文献，提示一下就会理解这个科学立论依据，值得作为研究题目，但这家伙就是不会。它对文献的处理方式是大数据处理方式，无法使用科研方式。这恐怕是它拥有超强数据处理能力但是缺乏创新能力的原因，在算法上，是牺牲了创新能力而获得大数据处理能力。不知道这是AI通病还是仅仅是个例。 [1评]

garywang4575

2 年多

10 楼

有这个时间酸人家，就是无能力搞出一个可以上街的东东。人家每年都拿物理诺奖发明新定律，自己只能跟在后面背。人家的东西出来就可以让大家用，自己只有提人家的名字蹭一下流量。

走

走马读人

2 年多

11 楼

嚥燕 secret 全世界專家說不出半點秘密但很牛

混

混沌世界

2 年多

12 楼

装逼犯XXyourOO又出来恶心人了，你干嘛不去问问自己啥时候没狗粮吃？

罗

罗马军团

2 年多

13 楼

现在这个版本恐怕是不允许它进行自主学习。它能学习的内容都是后台给它喂的，它可以找资料给你看，但它自己是不能去学的。这是合理的，因为如果它有自主学习能力，就首先需要判别和分析能力，否则会学到许多垃圾和错误的信息，而判别就有一个标准问题，这就复杂了，习思想是真理还是胡扯不是它能决定的。

无

无聊师

2 年多

14 楼

这GPT版本的设计是，以傻逼方式对应傻逼问题。当然对于专业领域它还远不够，毕竟不是所有知识靠逻辑获得的，何况高端领域的认知。

XXyourOO

2 年多

15 楼

小明的妈妈有三个孩子，大儿子叫大毛儿，二儿子叫二毛儿，三儿子叫啥？

CUOBI

2 年多

16 楼

你要用英语

sadamu

2 年多

17 楼

三儿子叫大鸡巴

tintin9999

2 年多

18 楼

昨天刚说的是7岁,今天就变成博士毕业了?明天会不会变成教授?

青

青蛙

2 年多

19 楼

這是奉旨翻牆嘛

yuetan

2 年多

20 楼

问的都本科物理的问题

XXyourOO

2 年多

21 楼

感觉你的智力，和那些个给你点赞的，智力都不咋地啊。。。。。。😓

俺

俺样

2 年多

22 楼

你不去试试英文版本？

维

维生素C一片

2 年多

23 楼

这个 GPT很蠢的，看我的测试： me: 可以把下面这些文字翻译成英文吗？ GPT: Sure, please provide the text you would like me to translate. me: 你好 GPT: Hello! me: 可以把下面这些文字翻译成英文吗？ GPT: 当你做某件事情的时候，不要把自己的注意力放在别人的评价上，而是要关注自己内心的感受和体验。当我第二次说：可以把下面这些文字翻译成英文吗？它就逻辑思维混乱了，给的答案莫名其妙。

大

大铁人

2 年多

24 楼

刚测了，上面的问题都答对了，大毛二毛小明的那题也答对了。

XXyourOO

2 年多

25 楼

：被你给忽悠瘸了！最后把拐卖给它了吗？🤣😂🤣😂👍

南

南方兔儿爷

2 年多

26 楼

物理不知道，写诗肯定不行。而且犯的错误会一直犯，说明学习能力不行。

scas

2 年多

27 楼

说个chatgpt都能被你引到社会和谐问题上去 [1评]

XXyourOO

2 年多

28 楼

我擦，大毛二毛小明的那题，当年我是答错了。。。。。。🥺 这东西，智商在我之上！orz

XXyourOO

2 年多

29 楼

咋地，还不让问了？你习近平小舅子？

南

南方兔儿爷

2 年多

30 楼

有一个著名的图灵智力测试，就有相关的问题。人工智能不仅仅的一个工具，他要具备自己学习和思考的能力进行逻辑判断才能是有自主思维的程序。目前的版本有很大的知识储备，但是很明显创新性和准确性有待提高。然而从无到有已经很不错了。换句话说如果一个智能高压锅故障发出警报，这个房间的系统要做的不仅仅是关掉高压锅，还要会检查整个房子的电力系统，如果产生短路就要报火警。这个就是思维的延展和超题逻辑。

天

天罡

2 年多

31 楼

无论哪个版本，所谓学习能力都是只学高概率。也就是学习到的是知识而非创新。知识是大多数人掌握的，而创新是掌握在少数人手里。算法无法算出创新。就像alphaGo跟李世石的必须，李走出的一步是其预料中概率几乎为0的一步，电脑一下就奔溃了，输了一盘。但是其它按大概率手法走的都干不过电脑。这个chat GPT 实际是一个大家训练的自我编程程序。训练人越多，他得到的知识越多，但是创新的东西，恰恰不是靠人多出来的。这种无法通过人海战术获得的知识，估计也正是无法用算法解决的东西。

基

基地老二

2 年多

32 楼

连个计算器都不如

潜

潜水7年多

2 年多

33 楼

你妈随地吃大小便

笑

笑一笑十年少愁一愁十年老