韩国学生质疑华为大模型套壳抄袭 华为回应

今日头条
Toutiao
最新回复:2025年7月7日 2点34分 PT
  返回列表
80589 阅读
38 评论
人工智能学家

华为最新开源的盘古(Pangu)AI大模型,正深陷一场技术与伦理的风暴中心。

一场关于其核心技术是否“套壳抄袭”阿里巴巴通义千问(Qwen)模型的指控,已迅速从开发者社区的窃窃私语演变为行业瞩目的公开事件。华为于2025年7月5日发布官方声明,坚决否认了增量训练或抄袭的说法,并强调其行为严格遵循开源许可。但这起争议的意义已远超个案本身,它如同一面棱镜,折射出当前全球人工智能领域在“开源”旗帜下的模糊边界、信任困境与秩序重构的迫切需求。

一场由“指纹”引发的“血统”追问争议的导火索是一份于7月4日发布在代码托管平台GitHub上的技术分析报告。该报告的作者——一位自称为哥斯达黎加大学的韩国学生——采用了一种名为“LLM-Fingerprint”(大语言模型指纹)的技术,对华为盘古Pro MoE模型(总参数720亿)与阿里巴巴通义千问Qwen-2.5 14B模型进行了深度比对。

该技术的核心逻辑是,通过提取和分析模型中每个Transformer层的注意力参数(QKVO)的标准差,为每个模型生成一个独特的“指纹”向量。报告指出,盘古Pro MoE模型与通义千问模型在这一“指纹”上的相似度达到了惊人的0.927(理论最大值为1.0,代表完全一致)。这一数值远超不同独立训练模型间应有的正常差异范围,因此报告作者断定,这强烈指向了“非独立开发”的可能性。

为指控增添“实证”的,是研究者在盘古开源的代码文件中,发现了明确指向阿里巴巴的版权声明——“Copyright 2024 The Qwen team, Alibaba Group”。在许多开发者看来,这无异于一个“忘记擦除的脚印”,似乎坐实了盘古模型与通义千问之间存在直接的代码继承关系。尽管这份引发轩然大波的GitHub报告在发布后不久即被删除,但其提出的技术疑点和代码证据已在行业内迅速发酵,将华为推上了舆论的风口浪尖。

华为的辩护:创新、参考与开源精神面对汹涌的舆论,华为负责盘古大模型研发的核心团队——诺亚方舟实验室,在事发次日(7月5日)午后迅速做出回应。这份声明的核心,可以概括为三点:独立创新的坚定立场、对开源实践的合规遵循,以及对社区共建的开放态度。

首先,华为方面明确切割了盘古模型与“基于其他厂商模型增量训练”的关联。声明强调,盘古Pro MoE是一个“基于昇腾(Ascend)硬件平台开发、训练的基础大模型”。华为特别指出了其关键创新——全球首个面向昇腾硬件设计的“分组混合专家模型(MoGE)”架构。据称,该架构有效解决了大规模分布式训练中的负载均衡难题,是其核心技术壁垒的体现,而非对他人的简单复刻。

其次,针对代码中出现的阿里版权声明,华为并未回避,而是将其定义为对业界开源实践的参考与尊重。盘古团队承认,“部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码”。他们认为,严格遵循开源许可证的要求,在代码中清晰标注原始版权声明,“不仅是开源社区的通行做法,也符合业界倡导的开源协作精神”。这番解释试图将一个看似“抄袭”的证据,重塑为一次合规、透明的开源协作行为。

最后,华为重申了其对开放创新和知识产权的尊重,并欢迎开发者在官方社区就技术细节进行深入、专业的交流。这份回应措辞严谨,试图从技术原创性、行为合规性和开源理念三个层面,全面化解外界的质疑。

超越个案:AI开源的“模糊地带”与信任危机华为盘古与阿里通义千问的这场风波,绝非孤例。它深刻地揭示了在人工智能大模型时代,传统软件领域的“开源”概念正面临前所未有的挑战。近年来,从零一万物(01.AI)的Yi系列模型被指架构与Meta的Llama高度相似,到斯坦福大学团队的Llama3-V项目被证实“套壳”了中国初创公司面壁智能的MiniCPM模型,类似的争议已屡见不鲜。

这些事件共同指向了一个核心问题:在AI大模型领域,开源的边界究竟在哪里?

传统的软件开源,主要涉及代码的开放。其许可证(如Apache, MIT, GPL)对代码的复制、修改、分发和商业使用有相对明确的规定。然而,一个AI大模型的核心价值,不仅在于其实现代码,更在于经过海量数据和巨大算力“炼”出的模型权重(即参数)。这些权重构成了模型的“智能”本身。目前,行业对于模型权重的开源、借鉴乃至“化用”,缺乏统一、清晰的法律和道德准绳。

使用一个开源模型的架构进行重新训练、参考部分实现代码、还是直接使用或微调他人训练好的模型权重,这三者之间存在着巨大的灰色地带。加之训练一个世界级大模型的成本动辄数亿甚至数十亿美元,这使得“站在巨人的肩膀上”成为一种普遍的技术发展路径和商业诱惑。正如DeepSeek等优秀开源底座模型的风靡所显示的,完全从零开始的自研已成为少数巨头的特权。

此次争议中,尽管有技术专家指出,仅凭“模型指纹”的标准差相似度来判定“抄袭”可能并不完全科学,但它无疑触动了行业最敏感的神经——信任。在一个依赖协作与共享精神的开源社区,任何关于“血统”纯洁性的疑虑,都可能侵蚀其赖以生存的根基。

截至目前,事件的另一方,阿里巴巴通义千问团队尚未对此事发表公开回应。然而,整个行业都在屏息凝视。这起事件的最终走向,无论结果如何,都将成为一个标志性的案例。它迫使所有参与者——从科技巨头到初创公司,再到每一位开发者——重新思考和定义AI时代的开源规则。如何在鼓励创新、加速技术迭代的同时,有效保护知识产权,建立一个公平、透明、可持续的开源新秩序,已成为全球人工智能行业亟待解决的重要课题。

据说据说
1 楼
华为不抄袭就不是华为了。 [3评]
苏浩
2 楼
华为的辩护:创新、参考与开源精神面对汹涌的舆论,华为负责盘古大模型研发的核心团队——诺亚方舟实验室。。。为啥取这种西方的名字?没有东方的灵魂。 [1评]
毒箭
3 楼
基本上都是抄袭 [1评]
B
Bermejo
4 楼
华为的抄袭,不叫抄袭!这个是向他的祖师阿Q学的。
t
tosefun
5 楼
诺亚方舟实验室发现上帝其实是盘古 lol
文学少年
6 楼
中国的企业互帮互助,关其他国家屁事。
s
sw2017
7 楼
那你棒子国或小本子也抄袭出来一个AI模型让大家瞧瞧。
无伤93
8 楼
抄你爹妈了。
灯塔路
9 楼
“抄袭”应该合法化 “抄袭”是一种“生存技能” 哈哈哈哈哈哈哈
M
Meller
10 楼
就像说,恁niang不出轨就不是恁niang一样!
M
Meller
11 楼
艹nmb! 韩国棒子连tmd AI第二梯队都进不了,懂个jb抄袭!?
m
mrp
12 楼
论抄袭?棒子被踩脚了吧
g
gaotyuan2
13 楼
哥斯达黎加大学的韩国学生? 发AI figerprint标准? 太抽象了 😆😆😆
a
anywho
14 楼
文化偷賊韓棒子真把自己當根蔥? 汪汪🐕殖狗奴而已!
a
anywho
15 楼
棒子,战争打起来连指挥权都没有的国家,还天天在中国人面前胡说八道瞎扯。它们真不知道自已的腚有多大吗,被美国反复揉搓、以偷文化为荣的南朝鲜有什么可骄傲的?鄙視👎 文化靠偷竊、體育靠陰招、自卑又自大、撒謊如呼籲空氣的文化愉賊韓棒子!從榫卯技術、儒學書院、漢服、屈原、孔子、端午節、中秋節、拔河甚至春節、到現在糖葫蘆、扇子、中國結、八卦、螺鈿漆器、甚至餃子⋯WTH! 還居然做假視頻派到意大利等歐洲各大學宣傳絲綢是棒子發明的、更離譜的是在土耳其造一個假牌子說絲綢之路是棒子國發明的和開始的⋯,毫無廉恥!
a
anywho
16 楼
pop= Kpop、泡菜=韓式泡菜、纸=韩纸、年糕=韩式年糕、炸酱面=韩式炸酱面、糖醋肉=韩式糖醋肉、饺子=韩式饺子、青瓷=高丽青瓷、烤肉=韩国烤肉、刺绣=高丽刺绣、排骨汤=韩式排骨汤、中医=韩医、针灸=韩国针灸、青龙白虎朱雀玄武=韩国神兽、春节=韩国春节、龙须糖=韩国龙须糖、中国风=东洋风、与韩国文化相似=起源于韩国、与中国文化相似就誣蔑中国抄袭、賊喊捉賊、只要是韩国用过的就变成韩国古代就有的了,例如浑天仪,神机箭,四神兽,活字印刷术,泡菜等等、一个整容业发达的国家,总想为自己的历史隆胸造假、棒子文化 偷竊国近几年偷了中国近两百多種历史文化遗产。
r
red_hat
17 楼
微软谷歌思科甲骨文亚马逊,你随便抄,你抄出个像样小公司就行 [1评]
s
stevecanada
18 楼
淘宝最初就是抄ebay,支付宝是抄PayPal,孔夫子旧书网抄亚马逊...,当然美国公司也抄袭,诸如博士伦等一批公司最早很多镜头抄袭英国的Dallmeyer,其他例子不胜枚举,互相借鉴(抄袭)很正常
s
stevecanada
19 楼
今天棒子包装很成功,加上体量小对西方不造成威胁,所以韩流在欧美还是有不少年轻人追捧
s
stevecanada
20 楼
华为有政府背景,运作很成功这一点不容否认,并且在很多地方都能独立于西方的技术也很重要,...但这个企业推行的不择手段卸磨杀驴式狼性文化很成问题,早些年挖北电墙角,也有过用相机拍摄的照片当作手机镜头成片,作假被戳穿,至于一碗粥用一人之力导致中加关系一度紧张...
沙拉维
21 楼
华为应该立刻拿出不是抄袭的直接有力证据,狠狠打这个韩国傻逼的脸!!!! 中国最优秀的企业,怎么能被人轻易污蔑。一定让造谣者付出沉重的代价! [1评]
一笔
22 楼
天天抄袭别人跳出来指责别人抄袭它,只要投点屎就有狗舔着,金三狗甲优先😂
r
red_hat
23 楼
炒模式和抄代码一样吗?
路人丫丫
24 楼
呵呵。。。党朝最优秀的企业恰恰就多次被人抓住抄袭。🤣
我要干冰冰
25 楼
原来是韩国人,那就说得通了
G
GORDONYANG
26 楼
棒子这是狗拿耗子。
打风苟
27 楼
之前并不了解这家公司,几年前听了他们的“华为5G技术世界遥遥领先”之后,才知道是咋回事,之后他们说啥都不会再信。
贝鲁特圣香油
28 楼
华为有点sb,有必要回应一个棒子吗?越来越sb了
f
firepoint
29 楼
天下第一笑话,专门抄袭人的棒子怀疑人家抄袭! 寿司,汉字,饺子,春节,端午…屈原都是朝鲜人?
j
jpeagle
30 楼
华为这样的解释就像: 阿里先写了本书,用软壳装发行。 华为也发行了同样的书,但用自己生产的硬壳包装。 别人问,这两本书是不是同一本书? 华为解释,我是用中国最先进的国产技术生产了这本硬壳书,书里面的内容严格遵循阿里的版权协议。所以这两本书不是一本书。
w
wasabi20071127
31 楼
墙国最伟大的公司有必要去回复一个学生的质疑吗?
谁主沉浮?
32 楼
: 没领先吗?哪国的5G技术超过了华为? 为啥美欧日要急嚯嚯搞6G技术? 傻逼!!
w
wilburwang
33 楼
你这带节奏找的点也太傻逼了。别的领不领先确实很多争议,但5G那尼玛100%遥遥领先没对手。看美国制裁的力度就知道了,美国禁用华为不奇怪,但用威胁的方式强迫盟友也不许用华为5G说明其他产品完全没竞争力
c
chigou
34 楼
傻屄,
B
BTY2684
35 楼
哥斯达黎加大学的韩国学生——这个背景一点可信度都没有……
岀自网络
36 楼
华为这个公司从诞生之初就爱抄袭。给几个案例: 1) “思科在诉状中称:“华为抄袭了思科的软件用于制作网络中转设备,但由于连漏洞也一并抄袭了过去,为了解决漏洞不得不推迟产品出货时间,甚至连手册中的错别字也原封不动地抄袭了过去。” 当时,思科的一位高层负责人前往位于中国广东省深圳的华为总部,会见了华为创始人任正非董事长并拿出了证据。但对于思科提出的抗议,任正非却只有一句话:“凑巧而已。” 次年,华为部分承认了抄袭思科软件的事实,并与思科达成了和解。 [2评]
岀自网络
37 楼
2) 2010年,摩托罗拉起诉华为。理由是华为窃取了摩托罗拉无线网络设备SC300的技术。在提起诉讼的7年前,一个名叫潘小伟(音)的摩托罗拉员工和两名同事一同前往北京,向任正非秘密阐述了摩托罗拉SC300的设计结构。据悉,潘小伟是任正非的亲戚。 此后,华为制造出了外形比SC300小的类似产品,开始在发展中国家出售。美国联邦调查局(FBI)2007年在芝加哥机场逮捕了潘小伟和与他共谋的一名华裔女性。在准备前往中国的该名女子的随身物品中发现了摩托罗拉的相关机密。当时FBI还在对任正非进行调查。此后,中国以摩托罗拉涉嫌违反本国的《反垄断法》为由对其展开调查,摩托罗拉随即取消了诉讼。
岀自网络
38 楼
3) 2004年在芝加哥举行的技术会议上,华为员工打开了在禁止出入区内展示的网络设备并拍摄电路板被当场发现。