GPT5 来了 - 2025年8月7日文学峸存档 - 看帖神器

← 下载《看帖神器》官方 iOS App，体验轻松追帖。

3 天

楼主 (文学峸)

经济价值型任务表现

在 OpenAI 内部一个评估基准上，GPT5 同样表现卓越，该测试专门评估模型在复杂、经济价值知识型工作上的表现。在启用推理功能时，GPT?5 在大约半数案例中的表现达到或超越人类专家水平，同时在法律、物流、销售、工程等 40 多个职业领域的综合任务表现上全面优于 o3 模型和 ChatGPT Agent。

3 天

据说没有大的突破，业界很失望的

3 天

比别的模型更强就行。要是真的AGI，咱们也没有存在的必要了

3 天

說了很久了，當下的LLM基本上到頭了，除非有基礎模型突破

3 天

Inch improvement. 以后是应用多了

3 天

Hallucination下降了很多，是很大进步

3 天

放心了，娃们的工作很长时间都没有问题。

3 天

應用也很crappy，你去看看什麼是RAG，等於你上完課去考試得帶八個TA輔助你考試

3 天

AI，AI，夢幻迷彩。。。

3 天

现在已经是CAG了。