最新全球十大AI模型排行榜出炉 中国产模型成黑马

今日头条
Toutiao
最新回复:2025年2月6日 4点59分 PT
  返回列表
77295 阅读
21 评论
自由财经

AI竞赛升温!最新全球十大模型榜单排名出炉,Google稳居第1,值得注意的是,近期阿里发表大语言模型Qwen2.5-Max跻身第7,领先DeepSeek V3、o1-Mini和Claude-3.5-Sonnet等顶级专有大语言模型。

至于前2名则由Google拿下,分别Gemini-2.0-Flash-Thinking-Exp-01-21与Gemini-Exp-1206,而OpenAI的ChatGPT-4o-latest(2024-11-20)与DeepSeek的DeepSeek-R1则并列第3。

外媒报道,在全球知名的AI模式评测平台Chatbot Arena公布了最新1期的榜单,其中,阿里通义千问团队的最新大语言模型Qwen2.5-Ma取得了优异成绩,在总体排名中跻身第7。

分别看打分细项,Qwen2.5-Max在技术领域表现特别出色,在数学和程式设计方面排名第1,在处理复杂任务的固定提示(hard prompts)方面排名第2。

继DeepSeek之后,Qwen2.5-Max的发布是中国AI阵营在高性能、低成本技术路线上的另一个重要突破。市场人士先前分析称,外界先前过度聚焦DeepSeek,却忽略了包括阿里通义在内的中国AI整体性追赶。如果阿里Qwen-2.5-max的性能确实展现出预期水平,加上其低成本优势与完整云生态,或引发DeepSeek之后的中国AI资产新一轮重估。

Qwen2.5-Max发布后,迅速吸引了海内外用户和开发者的大量关注。

有网友指出,Qwen2.5-Max相当于中文版的ChatGPT,但水平要比后者高得多。

有用户表示,Qwen2.5-Max“重新定义”了影片产生功能,已经超过OpenAI的Sora。

甚至有用户认为,Qwen2.5-Max已经把ChatGPT、DeepSeek狠狠“拍在沙滩上”了。

还有网友制作梗图,猜测继DeepSeek-R1后,这款来自中国的强大AI模型将进一步加剧OpenAI的担忧。

到此一留
1 楼
阿里水军真贱
j
jujubi
2 楼
这是哪位“网友”的高见? “有网友指出,Qwen2.5-Max相当于中文版的ChatGPT,但水平要比后者高得多。”
谁主沉浮?
3 楼
傻逼软文,不要碧莲! 真把读者当傻逼?
只想一个人
4 楼
厉害了
深愛著羊
5 楼
這裡有數據排名 https://blog.csdn.net/i826056899/article/details/145209762
t
tomtangwws
6 楼
中国AI大模型集体爆发,想压制者彻底绝望。 [1评]
d
dingding6
7 楼
外国排名一贯都是自夸自赞,自娱自乐,自我陶醉,没有人相信。
H
HL16888
8 楼
看到Google排第一就没必要看下去了,这个基本就是瞎扯
t
tiger500
9 楼
虽然狗粮殖人跟AI不粘边,狗粮殖人也绝望了!
买车有啥用呀
10 楼
很好奇如果Google排第一为什么没人喜欢用
榴莲车
11 楼
赶快排个名次,用心何在呢?
D
DDT666
12 楼
这种排名有什么意义?!世界银行物价指数:中国大陆为香港的80%、新加坡的85%、台湾的1.2倍。谁信谁傻逼。就不说大陆等于白送的蔬菜水果肉类等农产品,不说淘宝上各种便宜到卯的家电产品,就连相同品牌的汽车手机这样的消费品,大陆的价格也低得多。这么透明的状态,信息茧房捂都捂不住,还敢睁着眼睛说瞎话,一本正经的胡说八道。
我爱北京的秋天
13 楼
我觉得kimi也挺好用啊
v
vet
14 楼
付费
f
fhlgb
15 楼
傻逼台巴子
s
szacy
16 楼
Google AI 一文不值,完全靠自嗨炒作和胡吹。
T
TVB2786333
17 楼
Google 可能是自己帮趁(光雇)自己,制造高營业纪录,所以冲到第一。
中国的中
18 楼
谷歌主办的吧?
射刁英雄
19 楼
有种就把评测平台的捐助者名单、资金同时公布。孤狗儿傻钱多,AI烧钱多,正事不干,都烧在广告上了
五十而立
20 楼
拜托取个好名字吧,除了DeepSeek,都是tmd奇奇怪怪又绕口难读。
江南游侠
21 楼
讲个笑话,谷歌AI大模型排名第一😄