斯坦福Llama3-V团队承认抄袭清华大学大模型

f
fridec2
楼主 (北美华人网)
Stanford AI project authors apologize for plagiarizing Chinese large language model
https://technode.com/2024/06/04/stanford-ai-project-authors-apologize-for-plagiarizing-chinese-large-language-model/

f
fridec2
近日,国内AI创业公司面壁智能的大模型被美国斯坦福大学AI团队套壳抄袭的事件在网络引起热议。
事情的最新的进度是,斯坦福Llama3-V团队的两位作者Siddharth Sharma和 Aksh Garg在社交平台上就抄袭行为向面壁智能团队正式道歉,并表示会将Llama3-V模型悉数撤下。相似内容的道歉信,已于几小时前被作者发出一次,但被迅速删除。

现在,该斯坦福团队成员已删除他们在社交媒体上官宣模型的推文,并将该项目在Github和HuggingFace上的库一并删除。
事件起因是,斯坦福大学AI研究团队于5月29日发布了一个名为Llama3V的模型,该研究声称只要500美元就能训练出一个SOTA多模态模型,效果比肩GPT-4V、Gemini Ultra与Claude Opus。 因该研究团队3名作者拥有斯坦福大学、特斯拉、SpaceX的名校和大厂背景,Llama3V模型一经发布就引发了诸多关注。
但随后有网友发现,Llama3V与中国AI创业企业面壁智能在5月中旬发布的8B多模态开源小模型MiniCPM-Llama3-V 2.59(面壁小钢炮)高度重合,前者只是进行了一些重新格式化,并把图像切片、分词器、重采样器等变量重命名。
6月2日深夜,面壁智能团队证实,斯坦福大模型项目Llama3-V与MiniCPM一样,可以识别出“清华简”战国古文字,“不仅对得一模一样、连错得都一模一样”。这一古文字数据为研究团队花费数月从清华简上逐字扫描并人工标注得来,并未对外公开,证实抄袭事实。

f
feifeiduan
里面的彩蛋战国古文字让他们不得不承认
f
fridec2
Re Llama3V: Firstly, we want to apologize to the original authors of MiniCPM. @AkshGarg03 and I posted Llama3V with @mustafaaljadery. Mustafa wrote the code for the project. Aksh and I were both excited about multimodal models and liked the architectural extensions on top of… https://t.co/lzeIqo3JDW — Siddharth Sharma (@siddrrsh) June 3, 2024

两个小印道歉了。代码不是他们写的,他们负责推广
o
oqo
里面的彩蛋战国古文字让他们不得不承认
feifeiduan 发表于 2024-06-05 01:24

.
b
bigsnail
丢人啊!
x
xiaobitichong
回复 3楼 feifeiduan 的帖子
有个更狠的: 他们的模型按他们自己的说明文档运行不起来,配置文件错误, 发现者把清华模型的对应配置文件拷贝过去, 就可以运行了。
r
rainbowofmylife
抄袭得太草率了 好歹看看代码啊
I
IronFlower
烙印干这个一点不用奇怪
c
ca563
xiaobitichong 发表于 2024-06-05 02:02
回复 3楼 feifeiduan 的帖子
有个更狠的: 他们的模型按他们自己的说明文档运行不起来,配置文件错误, 发现者把清华模型的对应配置文件拷贝过去, 就可以运行了。

这抄的也太不用心了,烙印干活儿就是不认真
q
qas168888
没看懂那个彩蛋是怎么回事啊啊啊啊啊 谁来救救我
w
wanwanma
感觉美国名校会一个一个跌下神坛,最后沦落成只会收钱卖学位的克莱登大学……
k
kissingsherry
看名字是烙印吧,有什么奇怪的?嘿嘿
婚纱旗袍晚礼服
干了坏事:烙印不稀奇 干了好事:美国还是nb 波音和nasa也是这么被你们给忽悠瘸的吧?
m
minren
烙印造假的比率确实较大,如同老黑刑犯的比率较大,不能否认。
上次最大的造假“超导”也是烙印:
S
Summerview
斯坦福盛产骗子。
a
autumncolor22
靠PPT进斯坦福的?
c
cheezit1999
Summerview 发表于 2024-06-05 07:23
斯坦福盛产骗子。

以前讨论过,看看斯坦福喜欢招什么学生, 就知道出这种事情毫不奇怪。可惜了一个好学校,现在就成了骗子的乐园。
a
autumncolor22
3个本科生自己干的。两个印度本科生说另一个穆斯林说自己完成了coding, 他们两个只是推广。不是 research lab的项目。
AkshGarg03 and I posted Llama3V with @mustafaaljadery. Mustafa wrote the code for the project. Aksh and I were both excited about multimodal models and liked the architectural extensions on top of Idefics and Siglip that he described to us. Our role here was to help him promote the model on medium and twitter. We looked at recent papers to validate the novelty of the work but we were not informed of or made aware of any of the previous work by @OpenBMB . After seeing the twitter posts about this topic yesterday, we asked Mustafa about proof of originality for Llama3V and asked for the training code but we haven’t seen any response so far. We were waiting for Mustafa to take the lead but instead we are releasing our own statement.
w
wyzds
再往后,这种事情只会越来越多,人工智能这一块,中国很强的。米国政府各种操作想要防止人工智能技术外泄,连留学签证都要使劲背景调查看是不是来偷学人工智能的,殊不知,现在名校斯坦福已经开始抄起了国产的东西。
以后再做project,得塞点东西,比如清华简,竹书纪年,反书什么的,别人抄了一查就灵。

雁过
为啥这么容易被抄袭?黑客进去拿文件吗?
m
meftw
斯坦福校友表示,这个学校校风非常不好,人人都很浮躁梦想一朝致富。
j
jacketdog
他们仨会被开除吗?
c
ca563
wyzds 发表于 2024-06-05 08:22
再往后,这种事情只会越来越多,人工智能这一块,中国很强的。米国政府各种操作想要防止人工智能技术外泄,连留学签证都要使劲背景调查看是不是来偷学人工智能的,殊不知,现在名校斯坦福已经开始抄起了国产的东西。
以后再做project,得塞点东西,比如清华简,竹书纪年,反书什么的,别人抄了一查就灵。


关键技术就不应该发表,省得被抄了
h
hoxu
autumncolor22 发表于 2024-06-05 08:11
3个本科生自己干的。两个印度本科生说另一个穆斯林说自己完成了coding, 他们两个只是推广。不是 research lab的项目。
AkshGarg03 and I posted Llama3V with @mustafaaljadery. Mustafa wrote the code for the project. Aksh and I were both excited about multimodal models and liked the architectural extensions on top of Idefics and Siglip that he described to us. Our role here was to help him promote the model on medium and twitter. We looked at recent papers to validate the novelty of the work but we were not informed of or made aware of any of the previous work by @OpenBMB . After seeing the twitter posts about this topic yesterday, we asked Mustafa about proof of originality for Llama3V and asked for the training code but we haven’t seen any response so far. We were waiting for Mustafa to take the lead but instead we are releasing our own statement.

感情这两啥都没做。成了抢功劳,出事了一抹净。静看 Stanford 如何处理。
猪舌头
wyzds 发表于 2024-06-05 08:22
再往后,这种事情只会越来越多,人工智能这一块,中国很强的。米国政府各种操作想要防止人工智能技术外泄,连留学签证都要使劲背景调查看是不是来偷学人工智能的,殊不知,现在名校斯坦福已经开始抄起了国产的东西。
以后再做project,得塞点东西,比如清华简,竹书纪年,反书什么的,别人抄了一查就灵。


本来想说斯坦福多好的学校,可仔细想想,也没出什么模型都照搬,好歹抄个idea,自己复现一下。这也太丢人了
猪舌头
meftw 发表于 2024-06-05 10:26
斯坦福校友表示,这个学校校风非常不好,人人都很浮躁梦想一朝致富。

以前这么怀疑过,但是人家名气那么大,周围房子那么贵,显得我很酸。看来有些感觉是准的
果小小
校友没有任何反应吗?难道不应该开除吗?
河边垂钓
真可耻
o
olivia0216
想起上次regeneron小印高中生作假
万一没捉到进了藤校可不就是接着造假,
万一还没捉到就是下一个theranos
造假一条龙,只有更大胆,没有最大胆
n
nickbear
雁过 发表于 2024-06-05 08:32
为啥这么容易被抄袭?黑客进去拿文件吗?

开源的
h
heydude
呵呵, 美国天天弘扬什么leadership, 各种ppt大侠满天飞, 鄙视踏踏实实做事的人, 数学好的人被叫nerd, 总有一天会被反噬. 好日无边
t
thinredline
几个本科生算什么斯坦福团队。这个模型来源于meta 的llama3。大家都是在上面修修补补,搞点 fine tuning。
s
shoon_yee
Summerview 发表于 2024-06-05 07:23
斯坦福盛产骗子。

人家本来就是喜欢招这种人。
f
fridec2
qas168888 发表于 2024-06-05 05:57
没看懂那个彩蛋是怎么回事啊啊啊啊啊 谁来救救我

相当于加了个水印在里头,weights and bias 是抄别人的,给了特定的比较偏门的输入,输出大概率是固定的
G
GABA
heydude 发表于 2024-06-05 12:14
呵呵, 美国天天弘扬什么leadership, 各种ppt大侠满天飞, 鄙视踏踏实实做事的人, 数学好的人被叫nerd, 总有一天会被反噬. 好日无边

现在就在反噬了, 多年来的反智主义开始显现效果了。
y
youyouzou
xiaobitichong 发表于 2024-06-05 02:02
回复 3楼 feifeiduan 的帖子
有个更狠的: 他们的模型按他们自己的说明文档运行不起来,配置文件错误, 发现者把清华模型的对应配置文件拷贝过去, 就可以运行了。

😂
C
COHomeSearch
回复 22楼 meftw 的帖子
以前认识几个斯坦福当然医生一起搞了个startup 做类似鼻塞的东西,代替口罩的,上百刀一副。然而这三个医生和呼吸科没有毛线关系,一个眼科,一个妇科还有一个忘了。。
y
youyouzou
wyzds 发表于 2024-06-05 08:22
再往后,这种事情只会越来越多,人工智能这一块,中国很强的。米国政府各种操作想要防止人工智能技术外泄,连留学签证都要使劲背景调查看是不是来偷学人工智能的,殊不知,现在名校斯坦福已经开始抄起了国产的东西。
以后再做project,得塞点东西,比如清华简,竹书纪年,反书什么的,别人抄了一查就灵。


应该这样防伪 😂
剑骨琴心
COHomeSearch 发表于 2024-06-05 12:52
回复 22楼 meftw 的帖子
以前认识几个斯坦福当然医生一起搞了个startup 做类似鼻塞的东西,代替口罩的,上百刀一副。然而这三个医生和呼吸科没有毛线关系,一个眼科,一个妇科还有一个忘了。。

觉得有点儿搞笑
L
Lalala2022
美国这边学校不踏踏实实好好学习的风气真是不好
s
springwaterhot
隔壁楼有个家长说一个高中烙印 直接用手机拍照 自己娃的debt card,偷里面的钱。还有他的家长教育这位娃 坐公交车不用给钱
一生所爱
即没有斯坦福教授的指导 也没有任何funding 两个还没毕业的本科生在外面偷鸡摸狗 也赖到斯坦福头上 有点冤枉
a
autumncolor22
感情这两啥都没做。成了抢功劳,出事了一抹净。静看 Stanford 如何处理。
hoxu 发表于 2024-06-05 10:47

是啊,就是两小印本科生,听另一个穆斯林本科生说自己做了个东西,想把功劳揽自己头上,再赚点钱, 就抢着加进去。推广是成功了,结果被人发现抄袭。之后给穆斯林本科生发信要novelty 证据,没收到回音, 就赶紧把人throw under the bus, 把自己摘清。这三人人品都不行。感觉上斯坦福都是靠造假进的。
p
polyoma2002
一生所爱 发表于 2024-06-05 13:09
即没有斯坦福教授的指导 也没有任何funding 两个还没毕业的本科生在外面偷鸡摸狗 也赖到斯坦福头上 有点冤枉

谁叫斯坦福招这种学生呢?学生做出成绩就是斯坦福的骄傲,做坏事就不是斯坦福的耻辱了?
g
gongmaa
polyoma2002 发表于 2024-06-05 13:14
谁叫斯坦福招这种学生呢?学生做出成绩就是斯坦福的骄傲,做坏事就不是斯坦福的耻辱了?

一滴血检测大骗局的Elizabeth Homles也是斯坦福的
r
rainbowofmylife
autumncolor22 发表于 2024-06-05 13:11
是啊,就是两小印本科生,听另一个穆斯林本科生说自己做了个东西,想把功劳揽自己头上,再赚点钱, 就抢着加进去。推广是成功了,结果被人发现抄袭。之后给穆斯林本科生发信要novelty 证据,没收到回音, 就赶紧把人throw under the bus, 把自己摘清。这三人人品都不行。感觉上斯坦福都是靠造假进的。

三个大忽悠哈哈 穆斯林比烙印更能忽悠
l
littlecool
真是,美国这环境正好是这群人生存的土壤,领导窗ppt横行,名校继续。。。。
f
feo
回复 16楼 Summerview 的帖子
不仅骗子多,学术妲己也不少
J
Jennyw2017
很棒的学生,以后当大公司CEO的料。再多学个鞠躬道歉泯恩仇就更完美了。
简简单单123
Summerview 发表于 2024-06-05 07:23
斯坦福盛产骗子。


我们组以前招过一个斯坦福的博士,天了噜,连领域内最基本的东西都不会,真不知道他怎么混到博士学位的(韩国人)。听他说他导师都忙着开 startup,没时间搭理他。
f
feo
简简单单123 发表于 2024-06-05 13:41

我们组以前招过一个斯坦福的博士,天了噜,连领域内最基本的东西都不会,真不知道他怎么混到博士学位的(韩国人)。听他说他导师都忙着开 startup,没时间搭理他。

还有没有沦陷的top吗?感觉大学都不行了啊,MIT挺住
J
Jaelynleaf
斯坦福本来就不是常青藤的 靠一帮风投哄起来的 不知道 有个啥吹头
J
Jaelynleaf
现在还能撑着的名校的颜值的 是 加州理工,普林斯顿
f
feo
Jaelynleaf 发表于 2024-06-05 13:56
现在还能撑着的名校的颜值的 是 加州理工,普林斯顿

这就不得不提一下钱璐璐了
a
apprentice
简简单单123 发表于 2024-06-05 13:41

我们组以前招过一个斯坦福的博士,天了噜,连领域内最基本的东西都不会,真不知道他怎么混到博士学位的(韩国人)。听他说他导师都忙着开 startup,没时间搭理他。

教授们不踏踏实实做学问,一个个都要去创业,斯坦福学术实力堪忧……
J
Jaelynleaf
feo 发表于 2024-06-05 13:58
这就不得不提一下钱璐璐了

她现在还行吧 现在自己带一个团队 虽然比不上加州理工正牌大牛 但是 比版上不少妹子 是强得不是一点点了 而且她自己目前的领域 在加州理工里不算先头部队 当年不就是想留她老公吗 这个所有人都知道呀
水太清楚了 大鱼小鱼都跑了 留一两个小鱼了 平衡一下

s
shoon_yee
一生所爱 发表于 2024-06-05 13:09
即没有斯坦福教授的指导 也没有任何funding 两个还没毕业的本科生在外面偷鸡摸狗 也赖到斯坦福头上 有点冤枉

说明学校招生倾向有问题啊。 一滴血也是斯坦福,这些学生也是斯坦福,怎么就招了一堆这种人呢?看中的点其实就是他们这种“entrepreneurship”的一面。
s
shoon_yee
gongmaa 发表于 2024-06-05 13:17
一滴血检测大骗局的Elizabeth Homles也是斯坦福的

还有bankman-fried父母都是斯坦福教授,养的孩子也是这种类型,他们自己也是这种人。
q
queiny
回复 25楼 hoxu 的帖子
甩锅本领一流
b
bigbob
果小小 发表于 2024-06-05 11:07
校友没有任何反应吗?难道不应该开除吗?

瞎猜校方反应: Stanford stands with cheaters!
s
syzheng
雁过 发表于 2024-06-05 08:32
为啥这么容易被抄袭?黑客进去拿文件吗?

开源的呀。 就看你脸皮够不够厚,敢不敢说
小白兔兽性大发
Summerview 发表于 2024-06-05 07:23
斯坦福盛产骗子。

斯坦福的商业氛围太浓了,产骗子就是他们的传统。那个一滴血的Elizabeth Holmes也是斯坦福出来的。
彼岸天涯
一生所爱 发表于 2024-06-05 13:09
即没有斯坦福教授的指导 也没有任何funding 两个还没毕业的本科生在外面偷鸡摸狗 也赖到斯坦福头上 有点冤枉

首先斯坦福招了这种骗子入学,就是他们的锅。如果斯坦福事后完全没反应,不出分抄袭学生,更是他们的锅。
彼岸天涯
autumncolor22 发表于 2024-06-05 13:11
是啊,就是两小印本科生,听另一个穆斯林本科生说自己做了个东西,想把功劳揽自己头上,再赚点钱, 就抢着加进去。推广是成功了,结果被人发现抄袭。之后给穆斯林本科生发信要novelty 证据,没收到回音, 就赶紧把人throw under the bus, 把自己摘清。这三人人品都不行。感觉上斯坦福都是靠造假进的。

这三经常一起合作的,不是第一次。被发现了就想推卸责任,人品更差。
x
xiaomaomiaomiao
minren 发表于 2024-06-05 06:51
烙印造假的比率确实较大,如同老黑刑犯的比率较大,不能否认。
上次最大的造假“超导”也是烙印:

一看就普通人。真正聪明厉害的都有很强的气场在。
x
xsh
烙印怎么干的活?丢人
h
heyykitty0
斯坦福第一任校长为了夺权让学校往科技创新方向走,把斯坦福遗孀给毒死了…都是狠人。
c
cheezit1999
feo 发表于 2024-06-05 13:44
还有没有沦陷的top吗?感觉大学都不行了啊,MIT挺住

MIT是不是能挺住真的很难说。我们本地看最近几年T5招的学生,骗子去S和H最多。M招的男生以前一直是硬核娃,女生个别是硬核娃,多数是水娃。但今年听说有个本地某高中的男生,科研大明星那种(据说学校考试还作弊),居然被H据,但进了M。
周围的例子里面,骗子so far 进P和Y最少。家长们猜可能P读书太辛苦,骗子们不想进,Y的STEM没有其他四校那么厉害,骗子不屑进。
G
Grace222
shoon_yee 发表于 2024-06-05 14:23
说明学校招生倾向有问题啊。 一滴血也是斯坦福,这些学生也是斯坦福,怎么就招了一堆这种人呢?看中的点其实就是他们这种“entrepreneurship”的一面。

斯坦福这次真是丢人丢大了
3
3906
cheezit1999 发表于 2024-06-05 18:30
MIT是不是能挺住真的很难说。我们本地看最近几年T5招的学生,骗子去S和H最多。M招的男生以前一直是硬核娃,女生个别是硬核娃,多数是水娃。但今年听说有个本地某高中的男生,科研大明星那种(据说学校考试还作弊),居然被H据,但进了M。
周围的例子里面,骗子so far 进P和Y最少。家长们猜可能P读书太辛苦,骗子们不想进,Y的STEM没有其他四校那么厉害,骗子不屑进。

MIT的骗子并不少。当然不是斯坦福哈佛那样遍地是骗子。

3
3906
一生所爱 发表于 2024-06-05 13:09
即没有斯坦福教授的指导 也没有任何funding 两个还没毕业的本科生在外面偷鸡摸狗 也赖到斯坦福头上 有点冤枉

斯坦福就是教授里骗子最多。
不过我觉得有些教授只要这么一直骗下去,骗到死,就圆满了。我看现在有时候论坛上讨论起来,为那几个洗白的还不少LOL
m
meftw
3906 发表于 2024-06-05 19:25
斯坦福就是教授里骗子最多。
不过我觉得有些教授只要这么一直骗下去,骗到死,就圆满了。我看现在有时候论坛上讨论起来,为那几个洗白的还不少LOL

是这样。主要是湾区那氛围,即使你想专心做学术都会被带偏的
蔷薇307
ISEF的大奖不就给了一个造假的高中小印了吗,原因荒谬的可笑,参赛造假的人有多大胆地有多大产,评委们也不把关,水准可见一斑,这个浮躁的社会。
c
cheezit1999
蔷薇307 发表于 2024-06-05 20:20
ISEF的大奖不就给了一个造假的高中小印了吗,原因荒谬的可笑,参赛造假的人有多大胆地有多大产,评委们也不把关,水准可见一斑,这个浮躁的社会。

ISEF 现在就是个大粪坑似的,能捞出来一把骗子。我们本地进MIT的那个能包治百病的大骗子就得了ISEF的奖(听说是不小的奖,够他向MIT展示一下的那种),听那学校的学生说学校里所有人都知道他考AMC坐别人后面从头抄到尾。
d
dajiangyoude
ca563 发表于 2024-06-05 05:54
这抄的也太不用心了,烙印干活儿就是不认真

烙印干活用心就不叫烙印了
k
keluoyi
hoxu 发表于 2024-06-05 10:47
感情这两啥都没做。成了抢功劳,出事了一抹净。静看 Stanford 如何处理。

是的。公司里的烙印也是这样,平时抢老中的credit,出了问题甩锅给老中。
k
keluoyi
果小小 发表于 2024-06-05 11:07
校友没有任何反应吗?难道不应该开除吗?

哈哈,想起古墓派公知母知最喜欢说的“美国是诚信社会,绝不容忍抄袭/作弊的行为。”
k
keluoyi
springwaterhot 发表于 2024-06-05 13:08
隔壁楼有个家长说一个高中烙印 直接用手机拍照 自己娃的debt card,偷里面的钱。还有他的家长教育这位娃 坐公交车不用给钱

印度人的劣根性,不管烙印小印还是美国土生印,都改不掉。我的同事是ABI,从小南加中上产区长大,爸爸是HP的engineer,妈妈是UCLA的医生,家庭条件够好了吧?她去商店买平底鞋,把所有的鞋子都从中间对半折一遍,说是她妈教的,这样可以选出没有折痕的质量好的鞋。。。这么有钱的烙印都这么手贱毁公共的东西,那些从印度来的穷烙印还不知道怎么偷鸡摸狗呢。
B
BaiyanWen
keluoyi 发表于 2024-06-05 22:59
印度人的劣根性,不管烙印小印还是美国土生印,都改不掉。我的同事是ABI,从小南加中上产区长大,爸爸是HP的engineer,妈妈是UCLA的医生,家庭条件够好了吧?她去商店买平底鞋,把所有的鞋子都从中间对半折一遍,说是她妈教的,这样可以选出没有折痕的质量好的鞋。。。这么有钱的烙印都这么手贱毁公共的东西,那些从印度来的穷烙印还不知道怎么偷鸡摸狗呢。

反而是那种家里穷的烙印人挺好的。北印的人比较奸猾,南印的人比较实在。
S
Silverwing
斯坦福惯犯了
那个女乔布斯也是从斯坦福发家
这个学校怎么变成骗子天堂? 白瞎了当年是俺dream school
S
Silverwing
wyzds 发表于 2024-06-05 08:22
再往后,这种事情只会越来越多,人工智能这一块,中国很强的。米国政府各种操作想要防止人工智能技术外泄,连留学签证都要使劲背景调查看是不是来偷学人工智能的,殊不知,现在名校斯坦福已经开始抄起了国产的东西。
以后再做project,得塞点东西,比如清华简,竹书纪年,反书什么的,别人抄了一查就灵。


过几年坐等欧美宣称AI对人类危害巨大, 不能产能过剩!
就如现在的电车
s
syzheng
BaiyanWen 发表于 2024-06-05 23:54
反而是那种家里穷的烙印人挺好的。北印的人比较奸猾,南印的人比较实在。

最近有接触过一个南印来的PhD,专业技能实在是太差了,怎么办