13.8%和13.11%哪个大?《歌手》排名引热议

今日头条
Toutiao
最新回复:2024年7月17日 13点19分 PT
  返回列表
69304 阅读
19 评论
每日经济新闻

7月13日最新一期的《歌手》公布排名孙楠得票13.8%

外国歌手香缇莫得票13.11%。

引发了网友对排名的质疑

不少网友认为13.11%大于13.8%,

因此,香缇莫的得票率比孙楠高。

随后,关于13.8和13.11大小比较的话题,

迅速冲上微博热搜!

其实,这个知识点

在小学四年级的课本中就有答案。

然而,这道小学生难度的数学题

也难倒了一众海内外AI大模型。

据第一财经、财联社等媒体测试,ChatGPT、Kimi、智谱清言、商汤商量、阶跃星辰等大部分大模型应用纷纷翻车,而文心一言、字节豆包等少部分大模型则守住了尊严。

值得注意的是,ChatGPT等大模型出现了胡说八道的现象。在为13.8填补了13.80的零位数后,才得出了正确的回答。这类大模型说胡话的现象,在业界被称为大模型出现幻觉。此前,哈尔滨工业大学和华为的研究团队发表的综述论文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以应对复杂推理的情况。

有产业界人士表示,目前大模型的幻觉率仍然较高,这也是产业界缺乏真正颠覆性应用的原因之一,业界都在共同解决这一核心问题,让大模型在业务流程中变得更可控。

据极目新闻,今年6月19日,上海人工智能实验室发布首个AI高考全卷评测结果,本次评测采用全国新课标Ⅰ卷,其中,语文评卷显示,大模型的现代文阅读理解能力普遍较强,但不同模型的文言文阅读理解能力差距较大。大模型写的作文更像问答题,虽有针对性,但缺乏修饰,几乎不用人类考生都会使用的举例论证、引用论证、名人名言等手法。多数大模型不理解“本体”“喻体”“暗喻”等语文概念。对于文章中的一些“潜台词”,大模型也无法完全理解。

数学评卷显示,大模型的主观题回答相对凌乱,解题过程有迷惑性,甚至出现过程错误但得到正确答案的情况。大模型的公式记忆能力很强,但无法在解题过程中灵活运用。

大模型的英语整体表现良好,大模型写的英语作文普遍存在因超出字数限制被扣分的情况,而人类考生大多因为字数不够被扣分。

据第一财经,一位算法工程师认为,生成式的语言模型更像文科生而不是理科生。实际上语言模型在这样的数据训练过程中学到的是相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着大模型要学好数学,除了学习世界知识外,还应该有思维的训练,从而具备推理演绎能力。

不过,上述问题也正在慢慢被解决,在思维能力上更核心的可能还是训练语料的问题。大语言模型主要通过互联网上的文本数据进行训练,而这些数据中数学问题和解决方案相对较少,导致模型在数学推理和问题解决技能上的训练机会有限。

值得一提的是,大模型的复杂推理能力尤为重要,这关乎可靠性和准确性,是大模型在金融、工业等场景落地需要的关键能力。

“现在很多大模型的应用场景是客服、聊天等等,在聊天场景一本正经胡说八道影响不太大,但它很难在非常严肃的商业场合去落地。”上海人工智能实验室领军科学家林达华此前表示,复杂推理关系到落地应用时大模型的可靠性,例如在金融这样的场景下不能在数字上有差错,会对数学上的可靠性有较高的要求。另外随着大模型进入商用,若要分析一家公司的财报,甚至是工业领域要去分析一些技术文档,这时数学方面的计算能力就会成为一个壁垒。

l
linfeiying
1 楼
同感,这个玩意儿聊天,写诗甚至谈恋爱,似乎都没有问题,但真的叫他干活就不靠谱了
p
piaorou
2 楼
9漏鱼这么多?
天涯之外
3 楼
13.11比13.8大?13.8就是13.80!傻子怎么这么多? [1评]
赵子龙
4 楼
五毛连先有中国还是先有中共都搞不清
i
ichliebeWien
5 楼
粉红五毛韭菜连最基本的常识都没有 [1评]
c
cxy1223
6 楼
我觉得这说明ai的编程中有人工干预的痕迹。
老粉黑
7 楼
墙国文盲太多了,不奇怪,哈哈哈哈。 [1评]
G
Griller
8 楼
你要有些基本常识,无论学识,道德和能力平均。 中国年轻人>>中国普通人>>海外华人>>美国普通人。 如果你是中国年轻人,只是有自己喜欢的政治观点。那我同意你的判断。 如果你是海外华人,我觉得你的受教育程度,或者说学识能力可能有个体差异,但是你用的整体判断,我觉得很难成立。
G
Griller
9 楼
当你有疑惑的时候,用这个公式会让你的思考清晰很多。 无论学识,道德和能力平均。中国年轻人>>中国普通人>>海外华人>>美国普通人。 你如果是中国的年轻人,我觉得你说的整体的比较是对的。 如果你是海外华人,我觉得够呛。你应该也能感到这个不等式吧。 你觉得这个不等式如何?
天天看报
10 楼
被晃了一下!!!
t
totalfire
11 楼
13.11大于13.8?! 这结果,怎么就能让这么多人信了呢? 这帮人是不是觉得身高1.8米的人还没有身高1.11米的人高呢?
本文小编
12 楼
凡是看到节目有《歌》《声》《音》《乐》字眼都一律转台.
全通
13 楼
13.11%=0.1311 13.8%=0.1380 还哪个大? 从之前回复我的评论来看, 不是说所有人全是傻逼, 但绝大部分都是。 都懒得对他们说什么了。
z
zhangjiakou
14 楼
13.11 大,又长又大
善顶洞人
15 楼
这是在证明都是一群白痴在看歌手这种白痴节目
绵羊云
16 楼
这种事情如果发生在美国那就合情合理了。
c
cbyyz
17 楼
嗯,回复你的那个傻逼五毛很好的印证了你的观点
i
ichliebeWien
18 楼
: 的确!我特意用了“常识”二字而非“知识”。TA如果真能看懂的话……
i
ichliebeWien
19 楼
的确!我特意用了“常识”二字而非“知识”。TA如果真能看懂的话……