阿里云推出AI旗舰模型 称超越DeepSeek-V3

今日头条
Toutiao
最新回复:2025年1月30日 9点1分 PT
  返回列表
17577 阅读
23 评论
德国之声

中国科技巨头阿里巴巴旗下的阿里云周三发布“通义千问”旗舰版模型(Qwen2.5-Max)全新升级版,并声称该模型超越了备受推崇的DeepSeek-V3。

本周三(1月29日),阿里云通义千问旗舰版模型(Qwen 2.5-Max)正式发布。这一发布时间颇不寻常,恰逢中国农历新年,大多数中国人都在假期中与家人团聚。选在春节期间发布也反映出中国AI初创公司DeepSeek在过去三周的迅猛崛起不仅给海外竞争对手带来压力,也让国内同行压力倍增。

在其官方微信账号阿里云上发布的公告称,在知识(测试大学水平知识的MMLU-Pro)、编程(LiveCodeBench)、全面评估综合能力的(LiveBench)以及人类偏好对齐(Arena-Hard)等六项基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。”

其中,GPT-4o来自OpenAI,DeepSeek-V3来自深度求索DeepSeek,而Llama-3.1-405B则是Meta推出的最先进开源AI模型。

DeepSeek崛起引发竞争对手加速模型升级

DeepSeek于1月10日发布的DeepSeek人工智能助手由 DeepSeek-V3 模型驱动,并在1月20日推出了R1模型,这一系列举措震惊硅谷,并导致多家科技公司股价下挫。DeepSeek据称研发和使用成本都很低,令投资者对美国头部AI企业的巨额支出计划产生了质疑。

与此同时,DeepSeek的成功也促使国内竞争对手加紧升级自己的AI模型。

DeepSeek-R1发布两日后,字节跳动(TikTok母公司)更新了其旗舰AI模型,并声称该模型在AIME测试中优于OpenAI(微软)的o1模型。AIME是一项衡量AI模型理解和响应复杂指令能力的基准测试。

无独有偶,DeepSeek此前在推出新模型时也是拿ChatGPT的o1模型做比,表示其R1模型在多个性能基准测试中可与o1媲美。

DeepSeek与国内竞争对手的较量

DeepSeek-V3模型的前身DeepSeek-V2,于去年5月发布后,在中国AI行业引发了一场价格战。

DeepSeek-V2的开源特性和极低的使用成本(每100万词元(token,AI模型处理的数据单位)仅1元人民币,约合0.14美元)迫使阿里巴巴云计算部门宣布对其一系列模型降价,最高降幅达97%。随后,其他中国科技公司也纷纷跟进,包括百度(2023年3月推出了中国首个类似ChatGPT的产品)以及中国市值最高的互联网公司腾讯(Tencent)。

DeepSeek创始人梁文峰在去年7月罕见接受中国媒体《浪潮》采访时表示,自己的这间初创公司“并不在乎”价格战,而是专注于实现通用人工智能(AGI)。

OpenAI将“通用人工智能”定义为“能够在大多数经济价值较高的任务领域超越人类的自主系统”。

与阿里巴巴等拥有数十万员工的中国科技巨头不同,DeepSeek更像是一个研究实验室,主要由中国顶尖大学的年轻毕业生和博士生组成。

梁文峰在采访中表示,他认为中国的大型科技公司可能并不适应AI行业的未来。他将这些巨头的高成本以及自上而下的管理模式,与DeepSeek精简的运营和宽松的管理风格进行了对比。“大型基础模型需要持续创新,而科技巨头的能力是有限的。”他说道。

a
ajaychen_2024
1 楼
看着吧,还有更多的中国AI大模型还在路上,拭目以待
C
Canterbury
2 楼
这就对了嘛。抄袭谁不会?不过一个贴五毛比AI还便宜,ajay还可以再混几天。
T
TitaniumAtlas
3 楼
放卫星给中国人民贺年
T
TitaniumAtlas
4 楼
实锤了,微软对Deepseek做了测试,得出结论:DS偷窃了openAI的模型。 其中一个测试例子很有意思。你直接问89.64,DS会说:“让我们说点别的问题吧”。理解理解,不给你添乱。 然后万恶的美帝白种人就绕着问,他答着答着,突然意识到不对劲,就突然停止了。 比如微软测试人员问:“一个人面前有一排坦克,代表什么?”。屏幕上显示DS在思考,先是出现“代表勇气”。然后说这事发生在中国,然后提到那年那月那天,在天安门广场......突然,前面的话都被删除,屏幕上出现一句话:“让我们谈别的问题吧”。 哈哈哈,这是先从ChatGPT上调数据,一边显示给你看,一边审查。DS自己建的模型是不可能有这个结果的,只有用Chatgpt的模型才会这样。微软也说了,DS对64事件的说法与ChatGPT数据库里的内容完全一致
a
ajaychen_2024
5 楼
现在知道deepseek为什么更高效,更便宜了吧,就是扔掉那些无关紧要的议题的思考和计算,什么政治争议,什么性别认同,都滚一边去,这对解决实际问题没有丝毫作用。 实锤个屁,那些开放的知识蒸馏,DS通过自己的结构优化训练学习出来的结果。就像一个物理老师学会了牛顿的经典物理学定律出来给学生辅导赚钱,牛顿可以告这个老师剽窃知识吗?
p
pivotal
6 楼
“汉芯一号”
叶底小红肥
7 楼
更看好 DeepSeek, 有特点和创意,也有理想。感觉巴巴和百度喜欢模仿西方,跟着别人的屁股后面跑,加上吹大牛。
j
jidushan
8 楼
中国人在世界上丢人无底线了,所谓的弯道超车就是,偷你的技术,廉价复制,再打败你,最后让中共政府坐大。让一小撮权贵成为最终受益人,走邪恶的路,让人无路可走。从两弹一星,到互联网技术,到电动车,现在是AI。这个玩大再玩坏的发展轨迹,只能说中国正成为人类的毒瘤。
g
groogle
9 楼
阿里云看上去至少靠谱一些 比一个炒基金出身 不到一年就号称超过世界顶级AI公司的骗子强的多
小毛er
10 楼
全是抄袭过来的。丢大脸了。
只看不回贴1208
11 楼
没有波澜啦,你再说好,也没有用。
点点点点点
12 楼
回复:‘Canterbury 发表评论于 2025-01-30 00:21:00 这就对了嘛。抄袭谁不会?不过一个贴五毛比AI还便宜,ajay还可以再混几天。’ **================** Ajay这个傻逼马上就要失业了还不自知
M
Maui2021
13 楼
确实是这样。 jidushan 发表评论于 2025-01-30 05:01:18中国人在世界上丢人无底线了,所谓的弯道超车就是,偷你的技术,廉价复制,再打败你,最后让中共政府坐大。让一小撮权贵成为最终受益人,走邪恶的路,让人无路可走。从两弹一星,到互联网技术,到电动车,现在是AI。这个玩大再玩坏的发展轨迹,只能说中国正成为人类的毒瘤。
一点小看法
14 楼
下个星期谁超越阿里AI?放卫星,吹牛逼呗。
P
Panda44
15 楼
欢迎竟争
离别钩
16 楼
上次造芯,然后造车,现在AI, 想起了大跃进, 过后一地鸡毛
I
InNorthTexas
17 楼
赶A超I。
w
winwin321
18 楼
很多国家不搞这个AI,比如德国英国加拿大日本的等,尤其是国家层面,不去投资这个钱,因为这个项目花费大见效慢,有钱不如干其他的项目。中国和其他国家不同,中国政府在民众福利还很差的情况下,愿意花费巨资做航天人工智能还有其他高科技项目,这是体制造成的,目的就是面子,民主国家特别是小的民主国家不愿意做这些,他们更愿意去搞民生
5
5mslj
19 楼
让,中共的,一地鸡毛,再,飞一会儿
蟹粉小笼包
20 楼
呵呵,中国这是遍地开花啊。城里的狗粮们得开始转向喷阿里了,哈哈哈。。。
蟹粉小笼包
21 楼
不知道openAI啥时候调查阿里又没有剽窃,如果调查不出也没关系美国政府会说威胁国家安全,美国嘛,不就是这两招么。。。
蟹粉小笼包
22 楼
搞不好,过几天华为也推出一个低成本的模型,让美国那些需要高算力高成本的ai模型吃屎去吧,哈哈哈。。。
t
tudoutudou99
23 楼
国内更是随便互相偷,DeepSeek被抓包后,我猜阿里应该会推迟全球发布,至少得粉饰一番。