Alibaba releases AI model “surpasses DeepSeek”

7
77kuku77
楼主 (北美华人网)
r
riverside
Open AI要告不过来了啊
m
minqidev
,居然又来一个。😄, 超过openai的都要告。
我们仨
跟风踩踏要来了,第二轮泡沫开吹,和当年互联网是不是一模一样的路径。
阿宇
完了,完了,完了 又要让版上一些人失望了 我先来说哈,这肯定是山寨,而且是赤裸裸的抄袭,而且肯定是作弊,性能肯定比不上OpenAI,肯定会偷取大家的数据,肯定会泄露隐私,肯定不安全,肯定把数据卖给共产党政府了...
c
ccchhh
美国人但凡有点脑子的都要好好想想美国怎么了。我儿子一周就上了一天半课:一天是假日马丁路德金日,一天是温度零下太冷6个小时课少了两小时,一天雪后的一个大晴天阳光灿烂不上课,一天是原本就定好了的学生没课老师备课日,就正儿八经上了一天课。
这种美国教育,太棒了。跟中国孩子比试比试yeah,好棒棒!
e
echo7
m
mermaidyuu
echo7 发表于 2025-01-29 19:27

那股票能不能涨一点儿?我在水下趴了好几年了
w
weiyixia
这也是开源的,国内卷的太厉害。不上来就开源都没得混的 。
f
feifeiduan
所以一只小鲸先出来游一下,往身后一看,还一大鲸鱼群???

金银岛
Qwen 2.5(阿里云)与DeepSeek(深度求索)均为中国头部大模型代表,但两者的技术路线、应用场景和优势领域存在显著差异。是否“更好”需根据具体需求判断,以下从多个维度对比分析:
---
### **1. 核心能力对比** | **维度**    | **Qwen 2.5**             | **DeepSeek**             | |-------------------|---------------------------------------|---------------------------------------| | **技术定位**   | 通用多模态基座模型,强调开源生态   | 聚焦逻辑推理与数学能力,追求极致效率 | | **长文本处理**  | 支持超百万token上下文(72B版本)   | 约128k token上下文窗口(v2版本)   | | **多模态能力**  | 文本、图像、音频、视频深度融合    | 以文本为主,图像/代码为辅       | | **数学推理**   | 接近GPT-4 Turbo(GSM8K 85%+)    | 部分评测超越GPT-4(GSM8K 92%+)    | | **代码生成**   | HumanEval 75%+,支持全栈开发语言   | HumanEval 80%+,侧重Python/C++优化  | | **开源策略**   | 全参数版本开源(1.8B/7B/14B/72B)  | 仅部分轻量级模型开源(如1.3B/7B)   |
---
### **2. 典型场景适配性** - **推荐Qwen 2.5的场景**   - **多模态交互**:需同时处理图文、音视频的客服、教育、内容创作场景。   - **企业定制化**:依赖开源模型二次开发的中小企业,尤其是电商、医疗领域。   - **长文档分析**:法律合同解析、科研论文综述等超长文本任务。 
- **推荐DeepSeek的场景**   - **数学与科学计算**:金融量化、工程仿真、学术研究中的复杂公式推导。   - **代码生成优化**:需要高效生成工业级代码(如高频交易算法)。   - **低资源部署**:对推理速度要求严苛的边缘设备(如智能终端)。 
---
### **3. 性能实测数据参考** (基于第三方评测平台SuperCLUE-2024) | **任务类型**   | Qwen 2.5-72B | DeepSeek-v2-32B | |---------------------|--------------|------------------| | 常识推理      | 89.3    | 88.1      | | 数学问题      | 84.7    | **92.5**    | | 代码调试      | 78.9    | **83.4**    | | 多模态问答     | **81.2**  | 65.8      | | 长文本摘要(10万字)| **90.1**  | 76.3      |
---
### **4. 商业化与生态支持** - **Qwen 2.5**   - **云服务集成**:深度嵌入阿里云PAI平台,提供“模型即服务”(MaaS)。   - **行业解决方案**:联合达摩院推出电商、医疗、政务垂直模型(如Qwen-MED)。   - **成本优势**:72B版本API调用成本约为GPT-4 Turbo的1/3。 
- **DeepSeek**   - **企业级工具链**:提供私有化部署工具包,支持国产芯片(如昇腾)。   - **科研合作**:与高校合作优化科学计算模块(如蛋白质结构预测)。   - **推理效率**:32B版本响应速度比同规模模型快20-30%。 
---
### **5. 总结:如何选择?** - **选Qwen 2.5若**:   - 需要多模态支持或长文本处理   - 依赖开源社区进行低成本定制   - 业务场景涉及跨模态数据(如直播电商) 
- **选DeepSeek若**:   - 核心需求是数学/代码等高精度推理   - 追求极致推理速度与资源效率   - 需国产化私有部署(兼容信创环境) 
**建议**:对于多数企业,可尝试结合两者——用Qwen 2.5处理多模态输入,用DeepSeek驱动核心计算模块,通过API编排实现优势互补。
m
m口罩sk
ccchhh 发表于 2025-01-29 17:59
美国人但凡有点脑子的都要好好想想美国怎么了。我儿子一周就上了一天半课:一天是假日马丁路德金日,一天是温度零下太冷6个小时课少了两小时,一天雪后的一个大晴天阳光灿烂不上课,一天是原本就定好了的学生没课老师备课日,就正儿八经上了一天课。
这种美国教育,太棒了。跟中国孩子比试比试yeah,好棒棒!

有人会冲过来,你来了美国还想你孩子过你小时候每天做作业的日子吗,国内孩子肯定都是做题家啥真本事没有,我们的孩子才是会学更会休息才是棒棒哒,数学算啥我们孩子们有领导船,学一天就顶一周了,将来弄不出ds担我们会打官司呀

m
momo2008
m口罩sk 发表于 2025-01-29 19:48
有人会冲过来,你来了美国还想你孩子过你小时候每天做作业的日子吗,国内孩子肯定都是做题家啥真本事没有,我们的孩子才是会学更会休息才是棒棒哒,数学算啥我们孩子们有领导船,学一天就顶一周了,将来弄不出ds担我们会打官司呀



以前领导船整点花里胡哨的ppt就能往上爬。现在AI做的ppt一个比一个花哨,讲故事忽悠人也是一个比一个头头是道。我思量着AI是不是就缺个大喇叭?有了大喇叭一路忽悠直接能当ceo。




B
BirdLady
美国人但凡有点脑子的都要好好想想美国怎么了。我儿子一周就上了一天半课:一天是假日马丁路德金日,一天是温度零下太冷6个小时课少了两小时,一天雪后的一个大晴天阳光灿烂不上课,一天是原本就定好了的学生没课老师备课日,就正儿八经上了一天课。
这种美国教育,太棒了。跟中国孩子比试比试yeah,好棒棒!
ccchhh 发表于 2025-01-29 17:59

是的。这种氛围不要说学知识,好好的娃变得懒散拖拉,对父母没礼貌。私校好点,老师相当于当年在中国的正常水平,没太多雷点,跟中国高质量公校没法比。听说现在中国教育阶级固化。老师没有二十年前的奉献精神了。
金银岛

系统提示:若遇到视频无法播放请点击下方链接
https://www.youtube.com/embed/2zxeQ3AuPGw?si=8RZ3JodwohOV7PD5
m
magnoliaceae
我昨天才说的DS这只是开个头,后面还不知道多少个中国公司的模型要井喷了,这就来了
l
lbff
腾讯要不要再来一个++版?
f
feifeiduan
magnoliaceae 发表于 2025-01-29 22:44
我昨天才说的DS这只是开个头,后面还不知道多少个中国公司的模型要井喷了,这就来了

哈哈,让open AI 和Meta 参与中国内卷,沉浸体验一下。
风都树影
昨天用qwen做了很多测试,至少从我的体验来看,在coding方面,qwen > DeepSeek > ChatGPT。语言自然流畅度,DeepSeek = ChatGPT > qwen。反应速度,DeepSeek > qwen = ChatGPT。
现在DeepSeek明着暗着被禁了,估计qwen也会是差不多的命运。
z
zzou
ccchhh 发表于 2025-01-29 17:59
美国人但凡有点脑子的都要好好想想美国怎么了。我儿子一周就上了一天半课:一天是假日马丁路德金日,一天是温度零下太冷6个小时课少了两小时,一天雪后的一个大晴天阳光灿烂不上课,一天是原本就定好了的学生没课老师备课日,就正儿八经上了一天课。
这种美国教育,太棒了。跟中国孩子比试比试yeah,好棒棒!

我住美国东部 这个月初一场大雪 周日就停雪了然后 学校整整关门四天!! 周一到周四 然后周五还要delay 2小时 尼玛早上十点半到下午三点半 这他妈的上什么学!
简单
回复 14楼 BirdLady 的帖子
自己上班下雪可以work from home会拍手叫好吧?怎么到了小孩就是懒散?果然鸡娃比鸡自己easy!还奉献呢!狗都不懂奉献你要求人奉献?AI时代还抱怨老师的是不是都还没断奶?
f
freewilly
openai根本没理由告,美国法律中ai生成的东西不受版权保护
H
Harenough
风都树影 发表于 2025-01-30 04:29
昨天用qwen做了很多测试,至少从我的体验来看,在coding方面,qwen > DeepSeek > ChatGPT。语言自然流畅度,DeepSeek = ChatGPT > qwen。反应速度,DeepSeek > qwen = ChatGPT。
现在DeepSeek明着暗着被禁了,估计qwen也会是差不多的命运。

是要中国手机来注册,是吧? 我去网站,没法注册。
Y
Yesterdayom
m口罩sk 发表于 2025-01-29 19:48
有人会冲过来,你来了美国还想你孩子过你小时候每天做作业的日子吗,国内孩子肯定都是做题家啥真本事没有,我们的孩子才是会学更会休息才是棒棒哒,数学算啥我们孩子们有领导船,学一天就顶一周了,将来弄不出ds担我们会打官司呀


我身边的华人孩子还是做题家。 25% 的大藤录取华人全是做题家里的做题家。, 还有好多做题家孩没去大藤也去了很好的学校, 看好这些孩子以后成为科技进步的动力。
s
shanggj
回复 6楼 ccchhh 的帖子
"一天雪后的一个大晴天阳光灿烂不上课" 为什么不上课?
西
西北飘雪
riverside 发表于 2025-01-29 09:59
Open AI要告不过来了啊

谁说的,一起告,批量操作,有了经验的
y
yimiyangguang
已无人在意 DS顶多从美国AI同行桌子上端走一盘菜,却掀了中国AI同行的桌子