Alibaba releases AI model “surpasses DeepSeek” - 2025年1月30日北美华人网存档 -

77kuku77

7 个月

楼主 (北美华人网)

riverside

7 个月

Open AI要告不过来了啊

minqidev

7 个月

，居然又来一个。😄，超过openai的都要告。

我

我们仨

7 个月

跟风踩踏要来了，第二轮泡沫开吹，和当年互联网是不是一模一样的路径。

阿

阿宇

7 个月

完了，完了，完了又要让版上一些人失望了我先来说哈，这肯定是山寨，而且是赤裸裸的抄袭，而且肯定是作弊，性能肯定比不上OpenAI，肯定会偷取大家的数据，肯定会泄露隐私，肯定不安全，肯定把数据卖给共产党政府了...

ccchhh

7 个月

美国人但凡有点脑子的都要好好想想美国怎么了。我儿子一周就上了一天半课：一天是假日马丁路德金日，一天是温度零下太冷6个小时课少了两小时，一天雪后的一个大晴天阳光灿烂不上课，一天是原本就定好了的学生没课老师备课日，就正儿八经上了一天课。
这种美国教育，太棒了。跟中国孩子比试比试yeah，好棒棒！

echo7

7 个月

mermaidyuu

7 个月

echo7 发表于 2025-01-29 19:27

那股票能不能涨一点儿？我在水下趴了好几年了

weiyixia

7 个月

这也是开源的，国内卷的太厉害。不上来就开源都没得混的。

feifeiduan

7 个月

所以一只小鲸先出来游一下，往身后一看，还一大鲸鱼群？？？

金

金银岛

7 个月

Qwen 2.5（阿里云）与DeepSeek（深度求索）均为中国头部大模型代表，但两者的技术路线、应用场景和优势领域存在显著差异。是否“更好”需根据具体需求判断，以下从多个维度对比分析：
---
### **1. 核心能力对比** | **维度** | **Qwen 2.5** | **DeepSeek** | |-------------------|---------------------------------------|---------------------------------------| | **技术定位** | 通用多模态基座模型，强调开源生态 | 聚焦逻辑推理与数学能力，追求极致效率 | | **长文本处理** | 支持超百万token上下文（72B版本） | 约128k token上下文窗口（v2版本） | | **多模态能力** | 文本、图像、音频、视频深度融合 | 以文本为主，图像/代码为辅 | | **数学推理** | 接近GPT-4 Turbo（GSM8K 85%+） | 部分评测超越GPT-4（GSM8K 92%+） | | **代码生成** | HumanEval 75%+，支持全栈开发语言 | HumanEval 80%+，侧重Python/C++优化 | | **开源策略** | 全参数版本开源（1.8B/7B/14B/72B） | 仅部分轻量级模型开源（如1.3B/7B） |
---
### **2. 典型场景适配性** - **推荐Qwen 2.5的场景** - **多模态交互**：需同时处理图文、音视频的客服、教育、内容创作场景。 - **企业定制化**：依赖开源模型二次开发的中小企业，尤其是电商、医疗领域。 - **长文档分析**：法律合同解析、科研论文综述等超长文本任务。
- **推荐DeepSeek的场景** - **数学与科学计算**：金融量化、工程仿真、学术研究中的复杂公式推导。 - **代码生成优化**：需要高效生成工业级代码（如高频交易算法）。 - **低资源部署**：对推理速度要求严苛的边缘设备（如智能终端）。
---
### **3. 性能实测数据参考** （基于第三方评测平台SuperCLUE-2024） | **任务类型** | Qwen 2.5-72B | DeepSeek-v2-32B | |---------------------|--------------|------------------| | 常识推理 | 89.3 | 88.1 | | 数学问题 | 84.7 | **92.5** | | 代码调试 | 78.9 | **83.4** | | 多模态问答 | **81.2** | 65.8 | | 长文本摘要（10万字）| **90.1** | 76.3 |
---
### **4. 商业化与生态支持** - **Qwen 2.5** - **云服务集成**：深度嵌入阿里云PAI平台，提供“模型即服务”（MaaS）。 - **行业解决方案**：联合达摩院推出电商、医疗、政务垂直模型（如Qwen-MED）。 - **成本优势**：72B版本API调用成本约为GPT-4 Turbo的1/3。
- **DeepSeek** - **企业级工具链**：提供私有化部署工具包，支持国产芯片（如昇腾）。 - **科研合作**：与高校合作优化科学计算模块（如蛋白质结构预测）。 - **推理效率**：32B版本响应速度比同规模模型快20-30%。
---
### **5. 总结：如何选择？** - **选Qwen 2.5若**： - 需要多模态支持或长文本处理 - 依赖开源社区进行低成本定制 - 业务场景涉及跨模态数据（如直播电商）
- **选DeepSeek若**： - 核心需求是数学/代码等高精度推理 - 追求极致推理速度与资源效率 - 需国产化私有部署（兼容信创环境）
**建议**：对于多数企业，可尝试结合两者——用Qwen 2.5处理多模态输入，用DeepSeek驱动核心计算模块，通过API编排实现优势互补。

m口罩sk

7 个月

ccchhh 发表于 2025-01-29 17:59
美国人但凡有点脑子的都要好好想想美国怎么了。我儿子一周就上了一天半课：一天是假日马丁路德金日，一天是温度零下太冷6个小时课少了两小时，一天雪后的一个大晴天阳光灿烂不上课，一天是原本就定好了的学生没课老师备课日，就正儿八经上了一天课。
这种美国教育，太棒了。跟中国孩子比试比试yeah，好棒棒！

有人会冲过来，你来了美国还想你孩子过你小时候每天做作业的日子吗，国内孩子肯定都是做题家啥真本事没有，我们的孩子才是会学更会休息才是棒棒哒，数学算啥我们孩子们有领导船，学一天就顶一周了，将来弄不出ds担我们会打官司呀

momo2008

7 个月

m口罩sk 发表于 2025-01-29 19:48
有人会冲过来，你来了美国还想你孩子过你小时候每天做作业的日子吗，国内孩子肯定都是做题家啥真本事没有，我们的孩子才是会学更会休息才是棒棒哒，数学算啥我们孩子们有领导船，学一天就顶一周了，将来弄不出ds担我们会打官司呀

以前领导船整点花里胡哨的ppt就能往上爬。现在AI做的ppt一个比一个花哨，讲故事忽悠人也是一个比一个头头是道。我思量着AI是不是就缺个大喇叭？有了大喇叭一路忽悠直接能当ceo。

BirdLady

7 个月

美国人但凡有点脑子的都要好好想想美国怎么了。我儿子一周就上了一天半课：一天是假日马丁路德金日，一天是温度零下太冷6个小时课少了两小时，一天雪后的一个大晴天阳光灿烂不上课，一天是原本就定好了的学生没课老师备课日，就正儿八经上了一天课。
这种美国教育，太棒了。跟中国孩子比试比试yeah，好棒棒！
ccchhh 发表于 2025-01-29 17:59

是的。这种氛围不要说学知识，好好的娃变得懒散拖拉，对父母没礼貌。私校好点，老师相当于当年在中国的正常水平，没太多雷点，跟中国高质量公校没法比。听说现在中国教育阶级固化。老师没有二十年前的奉献精神了。

金

金银岛

7 个月

系统提示：若遇到视频无法播放请点击下方链接
https://www.youtube.com/embed/2zxeQ3AuPGw?si=8RZ3JodwohOV7PD5

magnoliaceae

7 个月

我昨天才说的DS这只是开个头，后面还不知道多少个中国公司的模型要井喷了，这就来了

lbff

7 个月

腾讯要不要再来一个++版？

feifeiduan

7 个月

magnoliaceae 发表于 2025-01-29 22:44
我昨天才说的DS这只是开个头，后面还不知道多少个中国公司的模型要井喷了，这就来了

哈哈，让open AI 和Meta 参与中国内卷，沉浸体验一下。

风

风都树影

7 个月

昨天用qwen做了很多测试，至少从我的体验来看，在coding方面，qwen > DeepSeek > ChatGPT。语言自然流畅度，DeepSeek = ChatGPT > qwen。反应速度，DeepSeek > qwen = ChatGPT。
现在DeepSeek明着暗着被禁了，估计qwen也会是差不多的命运。

zzou

7 个月

ccchhh 发表于 2025-01-29 17:59
美国人但凡有点脑子的都要好好想想美国怎么了。我儿子一周就上了一天半课：一天是假日马丁路德金日，一天是温度零下太冷6个小时课少了两小时，一天雪后的一个大晴天阳光灿烂不上课，一天是原本就定好了的学生没课老师备课日，就正儿八经上了一天课。
这种美国教育，太棒了。跟中国孩子比试比试yeah，好棒棒！

我住美国东部这个月初一场大雪周日就停雪了然后学校整整关门四天！！周一到周四然后周五还要delay 2小时尼玛早上十点半到下午三点半这他妈的上什么学！

简

简单

7 个月

回复 14楼 BirdLady 的帖子
自己上班下雪可以work from home会拍手叫好吧？怎么到了小孩就是懒散？果然鸡娃比鸡自己easy！还奉献呢！狗都不懂奉献你要求人奉献？AI时代还抱怨老师的是不是都还没断奶？

freewilly

7 个月

openai根本没理由告，美国法律中ai生成的东西不受版权保护

Harenough

7 个月

风都树影发表于 2025-01-30 04:29
昨天用qwen做了很多测试，至少从我的体验来看，在coding方面，qwen > DeepSeek > ChatGPT。语言自然流畅度，DeepSeek = ChatGPT > qwen。反应速度，DeepSeek > qwen = ChatGPT。
现在DeepSeek明着暗着被禁了，估计qwen也会是差不多的命运。

是要中国手机来注册，是吧？我去网站，没法注册。

Yesterdayom

7 个月

m口罩sk 发表于 2025-01-29 19:48
有人会冲过来，你来了美国还想你孩子过你小时候每天做作业的日子吗，国内孩子肯定都是做题家啥真本事没有，我们的孩子才是会学更会休息才是棒棒哒，数学算啥我们孩子们有领导船，学一天就顶一周了，将来弄不出ds担我们会打官司呀

我身边的华人孩子还是做题家。 25% 的大藤录取华人全是做题家里的做题家。，还有好多做题家孩没去大藤也去了很好的学校，看好这些孩子以后成为科技进步的动力。

shanggj

7 个月

回复 6楼 ccchhh 的帖子
"一天雪后的一个大晴天阳光灿烂不上课" 为什么不上课？

西

西北飘雪

7 个月

riverside 发表于 2025-01-29 09:59
Open AI要告不过来了啊

谁说的，一起告，批量操作，有了经验的

yimiyangguang

7 个月

已无人在意 DS顶多从美国AI同行桌子上端走一盘菜，却掀了中国AI同行的桌子