被斯坦福抄袭的中国大模型公司:法人年仅26岁

今日头条
Toutiao
最新回复:2024年6月4日 20点1分 PT
  返回列表
62808 阅读
25 评论
红星新闻

近日,斯坦福大学AI团队主导的Llama3-V开源模型被证实套壳抄袭国内清华与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V2.5一事,在网络上引发热议。

红星资本局了解到,6月3日,面壁智能CEO李大海与联合创始人刘知远先后发文回应此事,称“深表遗憾”:一方面表示这是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。“我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”

据第一财经消息,在最新进展中,斯坦福Llama3-V团队的两位作者Siddharth Sharma和Aksh Garg在社交平台上就这一学术不端行为向面壁MiniCPM团队正式道歉,并表示会将Llama3-V模型悉数撤下。

这家被套壳抄袭的国内大模型企业是什么来头?红星资本局发现,作为“清华系创投”公司,其在今年4月刚刚拿到新一轮数亿元融资。其法定代表人、同时也是技术1号位的曾国洋今年26岁,曾被外界誉为“少年天才”。

法定代表人年仅26岁,CEO曾任知乎CTO

官网显示,面壁智能是一家人工智能大模型技术创新与应用落地企业。公开资料显示,北京面壁智能科技有限责任公司成立于2022年8月,目前由北京清语启航科技中心(有限合伙)持股24.23%,曾国洋持股23.35%。

而面壁智能的“起源”或许更早。2021年,清华大学计算机系长聘副教授刘知远牵头成立了面壁智能,团队成员主要来自清华大学NLP实验室。

面壁智能的法定代表人曾国洋,同时也是面壁智能的CTO,出生于1998年,今年26岁。 在一些公开信息中不难窥探他“AI神童”的影子:8岁开始学编程,高二获全国青少年信息学竞赛金牌(全国50人)、亚太地区信息学竞赛金牌保送清华;高三时在“中国AI四小龙”之一旷视公司实习,自此正式踏入AI领域。

在今年4月份的一次采访中,曾国洋曾表示,“并不过分担忧落后的问题。”他提出OpenAI的技术路线可能并不适合自身发展,需要根据自己的实际情况和优势来制定发展策略。“一味地追求模型参数量这条路是走不通的,大模型的效率会很关键。”

红星资本局注意到,面壁智能的核心技术团队成员来自国内自然语言处理研究顶尖实验室,均具有知名大学博士和硕士研究生学历。在媒体报道中,面壁智能已经拥有超100人的科研团队,平均年龄28岁。团队的“清北”含量80%,此外还有来自阿里、字节、百度等一线公司的骨干。

面壁智能联合创始人、CEO为李大海,北京大学数学系硕士毕业,毕业后加入Google成为Google中国创始员工之一,2015年李大海加入知乎,任知乎合伙人、CTO。

联合创始人、首席科学家刘知远,为清华大学计算机系长聘副教授,智源青年科学家。在人工智能领域著名国际期刊和会议发表相关论文200余篇,Google Scholar统计引用超过3.1万次。刘知远曾获教育部自然科学一等奖、中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、入选国家青年人才计划、《麻省理工科技评论》中国区35岁以下科技创新35人榜单。

4月刚获数亿元融资

今年红杉AI Ascent 2024活动上,人工智能领域的领军人物吴恩达教授发表了关于AI Agent的前瞻性演讲。在分享中他提到了一个多Agent系统的示例 ——ChatDev,并表示多Agent合作实际效果比想象的更好。

红星资本局注意到,ChatDev正是由面壁智能联合清华大学NLP实验室共同开发的大模型全流程自动化软件开发框架。

就在4月11日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。

截图自天眼查APP

在今年的中关村论坛年会上,来自面壁智能的AI Agent智能体应用与端侧模型“小钢炮”MiniCPM均亮相“10项重大科技成果重磅发布”环节。

5月28日,面壁智能还公布了关于“小钢炮”的最新进展。李大海在演讲中表示,日前发布的MiniCPM-Llama3-V2.5是当前全球最强端侧多模态模型。以仅8B的体量,取得了超越多模态巨无霸Gemini Pro、GPT-4V的多模态综合性能,并且实现了OCR能力SOTA。

图据面壁智能公众号

据介绍,目前新一代“小钢炮”多模态模型已在端侧高效运行:通过首次端侧系统级多模态加速,实现了快150倍的图像编码速度提升。且量化后仅占用8G显存,4070消费级显卡即可轻松推理,并可在手机端以6-8tokens/s速度高效运行。

当前MiniCPM-V系列下载总量已超13万,一经发布即广受全球开源社区欢迎,火速登顶HuggingFace与GitHub Trending榜第一。

c
crunchtime
1 楼
民主的小偷,从小做起。
为啥一定要笔名
2 楼
斯坦福Llama3-V团队的两位作者Siddharth Sharma和Aksh Garg 三哥 [1评]
牛牛牛
3 楼
查了一下,就两个斯坦福的本科生,估计就是用在课程作业里了
a
aanz
4 楼
阿差牛逼
d
dingding6
5 楼
以前是中国仿制外国技术,现在是外国偷窃中国高科技。东升西降,由此可见一斑。 [1评]
p
piggy_piggy
6 楼
难道你不知道清华的模型是基于Meta的开源模型Llama ? [1评]
打哈欠
7 楼
非法访问境外网站, 泄露禁止出口的尖端技术。
s
santan
8 楼
它是五毛蛆 只知道吃主子屎
x
xiaoss188g
9 楼
我不熟悉ai,但我说一下自己的关注点,MiniCPM-Llama3-V2.5,这个v25就是版本号,Llama这个是meta脸书2023年2月份公布的开源自动进化大语言模型。这个清北公司这是在脸书开源的系统上花了一年多时间做了点东西,应该就像linux那样,别人把东西都做好了,可以给大家用,你自己在上面可以加东西。当然可以说你啥都不懂,做不成那个玩意,别人写出来以后,你读读源代码,理解别人思路,然后自己整活,就相当于微软windows系统开源,你在上面整活,你能有多伟大呢?相比而言,李开复的创新工场也搞了一个世界知名的 ai,据说性能和chatgpt,google的gemini差不多,吊打国内ai。这个世界openai和google的ai最先进,meta紧随其后,国内一群公司如何在借用meta的代码去吊打google呢?另外,CEO为李大海毕业后加入Google成为Google中国创始员工之一,知道google创始员工啥意思吗?就是打工仔,而且是2000年左右,这说明了那个人最青春年华掌握的技术已经过时了,这个不是加分项。刘知远,为清华大学计算机系长聘副教授,这个名头很多此一举,屁民听起来好像是顶级科学家一样 [1评]
x
xiaoss188g
10 楼
这个公司可能看到李开复在吹牛,也学着李开复吹牛的方式再吹一次,只不过加了一个让人大吃一惊的料,斯坦福大学偷自己技术,实质都是在做广告。自己本身就是在偷,只不过是别人meta允许的情况下偷。中国的技术说句不好听的话,别人不帮助,差别人几十年,别人帮助下,自夸差一年。
x
xiaoss188g
11 楼
和国内吹牛方式如出一辙。反正就是不管逻辑的拼命乱吹,真打起来的时候兵败如山倒,因为没一样行的。没打起来的时候咱屁民智商低见识少,看到开心的东西就起哄。一听说差几个月多高兴,现在想想阿里巴巴那个搞人工智能的达摩院是不是完全废掉了。就像中国五千年文明一样,搞了五千年,没一样有用的,根本反世界潮流,不能发展到现代文明,只能在100多年前完全放弃。这个达摩院搞的东西估计也是完全发展不到现在的ai,反正meta开源,不如转身读代码,写两行持续,找几个清北学生,编个好故事,然后就可以卖货了。 [1评]
y
youmyyou2016
12 楼
- 人家在拼命努力, 你在网上开口喷粪。。。 给这些年轻人尊重很难吗?中国吹牛的人肯定有,踏实干事情的更一定有。最终还是靠实力说话的
y
youmyyou2016
13 楼
- 恶心的傻x,不懂就闭嘴不要瞎喷粪
t
tiger500
14 楼
斯坦福抄袭居然抄袭一名26岁的中国人? 我不信。
t
tiger500
15 楼
谁做的好就抄谁的!没毛病。
A
AMONIA
16 楼
印度人的短视和投机取巧是刻在骨头里的。
顽童在线
17 楼
呵呵,新质意淫,没记错的话,应该是去年开源的吧。吹牛逼也是个技术活。
d
dingding6
18 楼
难道你不知道开源码可以随便用,不是偷窃嘛?
翩翩中年
19 楼
抄中国人的东西算抄吗?直接拿,不丢人。
d
demu
20 楼
llama3不是小札的吗?三哥应该是抄了抄作业的
纵横捭阖
21 楼
那么它们最初的AI模型是抄袭谁的?
五谷不分
22 楼
狗屁不通的玩意,居然洋洋洒洒写了这么大一坨,你也是真能拉啊
T
TBZ
23 楼
好tbz
w
wangppp
24 楼
不行,你美爹都吓尿了
中坚力量
25 楼
美国公司 不是都公开专利的吗? 造福人类 别扯什么专利权了 抄袭 也是为了人类进步 对吧