Meta GenAI部门很快要裁员了。被DeepSeek吓的。

h
helloterran4
楼主 (北美华人网)
DeepSeek只花了550万刀就训练出吊打Llama4的模型。
Meta搞GenAI的十几个头头,每人的包裹都不止550万刀。
这就是中美竞争的写照吧。
o
olivia0216
open ai 很快也要现原形
奥特曼的魔法快要失灵了
R
Riverss
中国这次真的牛大了,一个投资500万的投行side project,做出了n个亿的效果
C
COHomeSearch
回复 3楼 Riverss 的帖子
换个角度看 是不是说明美国大厂80%的人都没有实际产出(2:8定律)
d
dpg
难道裁员了就能追上了吗?
o
olivia0216
难道裁员了就能追上了吗?
dpg 发表于 2025-01-23 16:52

追不上但是可以省钱了 毕竟每个人都有百万包裹,50个就得半亿
y
yurik
meta GenAI的VP都是从RL之类的地方跳过去的empire builder,没一个懂ML/AI,能搞的好才怪。
w
weiyixia
有可能一开始就是故意的, 把简单的事情复杂化。 不断要 head count, 不断要funding. 本来一直其他国家都慢很多, 没法challenge, 现在哪知道中国这么快就赶上来, 把底都戳破了。
g
goodluckall
Stargate的5000billion这下🉑怎么花得完
s
susansd
Riverss 发表于 2025-01-23 16:51
中国这次真的牛大了,一个投资500万的投行side project,做出了n个亿的效果

不只是N个亿,是几十上百个亿。
w
weiyixia
懂行的说说为什么deepseek要开源??
f
feifeiduan
裁了也没用,能把成本降到百分之一吗
N
Namama

一直没想明白为啥 DeepSeek要开源。。
算力已经被美国人通过封锁芯片而卡死了 现在难得在算法取得重大突破,难道不该稍微保密一下?
公布个结果就可以了,把整个思路算法都公开,真的有必要吗?
n
niuniudabao
先把horizon搞掉行吗~
g
goodluckall
回复 13楼 Namama 的帖子
开源让大家都直接用啊,training数据越多越好
o
olivia0216
Namama 发表于 2025-01-23 17:00

一直没想明白为啥 DeepSeek要开源。。
算力已经被美国人通过封锁芯片而卡死了 现在难得在算法取得重大突破,难道不该稍微保密一下?
公布个结果就可以了,把整个思路算法都公开,真的有必要吗?

因为deepseek本来就没花太多钱,就当开源造福人类了 meta的也是开源啊 中国现在很多黑科技,不在乎这点
R
Riverss
懂行的说说为什么deepseek要开源??
weiyixia 发表于 2025-01-23 16:58

我看一个说法就是谁都可以用,断了openai这一堆大公司closed source ai的后路,而且据说还有更厉害的模型没公布
n
nickbear
weiyixia 发表于 2025-01-23 16:58
懂行的说说为什么deepseek要开源??

开源的只是模型参数,train的细节肯定有保留 deepseek开源主要是为了打广告 因为大厂和openai已经把服务市场占了 一个后来者想打出名声,开源让大家自己验货是最简单有效的方法 从结果来说效果也很好,关注大大增加,投资也来了

N
Namama
nickbear 发表于 2025-01-23 17:08
开源的只是模型参数,train的细节肯定有保留 deepseek开源主要是为了打广告 因为大厂和openai已经把服务市场占了 一个后来者想打出名声,开源让大家自己验货是最简单有效的方法 从结果来说效果也很好,关注大大增加,投资也来了


这和广告没啥关系吧? 美国各大厂的AI,对中国都有各种封锁限制。。
中美AI科技战打的那么厉害,现在两边是分开的不同市场
DeepSeek开源比Meta更加彻底。。 而且他这里的关键就是思路,把这个公布了,具体参数的调制其实只要堆人堆资源就能解决,不难的。。

N
Namama
olivia0216 发表于 2025-01-23 17:05
因为deepseek本来就没花太多钱,就当开源造福人类了 meta的也是开源啊 中国现在很多黑科技,不在乎这点

中美科技战打的那么厉害。。 双方各自都投入了上万亿美元竞争。。
然后搞开源造福人类,把自己最先进的算法思路给公开了?
难以理解。。
d
donan123
weiyixia 发表于 2025-01-23 16:58
懂行的说说为什么deepseek要开源??

一个字:so? 两个字: 自信 三个字:我愿意 四个字:多大点事
o
olivia0216
deepseek用的很多是清北应届和在校大学生,顶多就是博士后的成本,成本真没法比
y
youdai
Meta命不久矣,Metaverse的死亡就是预兆。要活得改名 OpenAI闭源的思路是对的,行业领头羊,手里得有秘密武器
o
olivia0216
Meta命不久矣,Metaverse的死亡就是预兆。要活得改名 OpenAI闭源的思路是对的,行业领头羊,手里得有秘密武器
youdai 发表于 2025-01-23 17:20

软件没办法闭源,毫无意义
只要核心成员被挖跳槽,分分钟复制一个。
软件公司那么多,大都靠不断融资,很多根本没法盈利
m
minqidev
就和极越破产一样。花的都是冤枉钱
雷军接受采访的时候,跟记者说,造汽车老花钱了。我好不容易掏出了100亿,造了个工厂,车子设计好了,一个月可以产一万多辆车。 光logo花了500万。

极越的老总在边上不说话,后来破产了,大家都知道。 他们光一个logo和名字专利,或者相关内容的总耗费将近10个亿。 还有一个汽车哪吒电动车,周鸿祎投资的,光一个logo设计费,2个亿。
好多就是洗钱,真花不了那么多钱

t
tommyr
weiyixia 发表于 2025-01-23 16:58
懂行的说说为什么deepseek要开源??

因为AI不是他们的主业,是一个量化基金公司搞得项目。
y
yangbuhui
我昨天听一个podcast 分析这个担忧,假设美国的头部模型还是最好的,但是要花$$$$$,中国的模型稍差一丢丢,但是只花$$$,那其他国家投资AI,比如印尼,菲律宾,这样的,就要好好想想为什么需要花大价钱买美国的不买中国的。所以中国这时候抢占市场先机还是挺有意义的。另外听说阿里的模型也非常不错了
y
youdai
olivia0216 发表于 2025-01-23 17:22
软件没办法闭源,毫无意义
只要核心成员被挖跳槽,分分钟复制一个。
软件公司那么多,大都靠不断融资,很多根本没法盈利

不能跟现有的软件框架比较,AI是系统工程,需要路径积累。OpenAI跳槽的牛人多了,创新产品一个都没有,都是跟着行业老大亦步亦趋
y
youyouzou
回复 4楼 的帖子

谁说没有?那么多document, 商业秘密,PPT,和领导船,都是产出。
养了那么多高薪,房地产GDP,税收为美国贡献巨大。

d
donan123
olivia0216 发表于 2025-01-23 17:18
deepseek用的很多是清北应届和在校大学生,顶多就是博士后的成本,成本真没法比

清华本硕毕业的AI专业的,起薪就能找到30~50万人币的工作,在北京
w
wmn
谁能证明这个人真是Meta的,还是伪装的水军,来打广告的?
N
Namama
Namama 发表于 2025-01-23 17:18
中美科技战打的那么厉害。。 双方各自都投入了上万亿美元竞争。。
然后搞开源造福人类,把自己最先进的算法思路给公开了?
难以理解。。

举个例子。。
如果当初谷歌没有公布transformer的论文,完全保密,那么其他组织发现transformer起码也要好几年吧。。
在科技战里,几年的时间太重要了。。 美国对中国的芯片封锁,其实也就是拖慢中国几年而已。。
风轻雨
olivia0216 发表于 2025-01-23 16:49
open ai 很快也要现原形
奥特曼的魔法快要失灵了

open ai 现在就整天吹牛皮了
风轻雨
goodluckall 发表于 2025-01-23 17:03
回复 13楼 Namama 的帖子
开源让大家都直接用啊,training数据越多越好

开源对中国有利,吸引大家都跑到中国的平台上开发
n
nazaban
COHomeSearch 发表于 2025-01-23 16:52
回复 3楼 Riverss 的帖子
换个角度看 是不是说明美国大厂80%的人都没有实际产出(2:8定律)

twitter 裁员80% 也没啥事
c
ca563
Namama 发表于 2025-01-23 17:00

一直没想明白为啥 DeepSeek要开源。。
算力已经被美国人通过封锁芯片而卡死了 现在难得在算法取得重大突破,难道不该稍微保密一下?
公布个结果就可以了,把整个思路算法都公开,真的有必要吗?

也许他们手里有更好的牌?我当年参加过一个热门项目,最后公司申请专利的是备选的design,就是为了mislead competitors。
y
youyouzou
回复 36楼 ca563 的帖子

二手板凳选手都这么厉害?
c
ca563
youyouzou 发表于 2025-01-23 18:23
回复 36楼 ca563 的帖子

二手板凳选手都这么厉害?

新药研发,小分子的design很多方案的。
a
alama
Namama 发表于 2025-01-23 17:42
举个例子。。
如果当初谷歌没有公布transformer的论文,完全保密,那么其他组织发现transformer起码也要好几年吧。。
在科技战里,几年的时间太重要了。。 美国对中国的芯片封锁,其实也就是拖慢中国几年而已。。

论文到成功的模型之间有巨大的鸿沟,google没有继续搞下去,这就是为啥Google落后openAI得原因,openAI的“秘密武器”不是自己搞出来的,google也是等openAI搞出名堂,才弄了个Gemini,大家都是互相学习进步的,越基础越公开,要让另外一波人搞出东西才有收益,真有收益也就不会公开了
o
oleander
大公司真正做事的没几个人,那些不做事的制造各种繁冗的所谓管理的流程,都不是在create value, 而是destory value.
c
custom
是因为跟meta比较了吗,为什么OpenAI不恐惧呢,哦,它们最近从川普那捞了不少钱,还能花一阵
N
Namama
alama 发表于 2025-01-23 20:22
论文到成功的模型之间有巨大的鸿沟,google没有继续搞下去,这就是为啥Google落后openAI得原因,openAI的“秘密武器”不是自己搞出来的,google也是等openAI搞出名堂,才弄了个Gemini,大家都是互相学习进步的,越基础越公开,要让另外一波人搞出东西才有收益,真有收益也就不会公开了

理论上是如此,但美国现在对中国是各种封锁。。 OpenAI也闭源了,Meta也搞伪开源。。 这种背景下,Deepseek这种单方面的公开,岂不是很吃亏?
特别是他们这个算法上的突破,是有效打破美国对华芯片/算力封锁的最大武器之一。。 结果就这样主动公开了,太亏了。。

e
ecnanif
goodluckall 发表于 2025-01-23 16:57
Stargate的5000billion这下🉑怎么花得完


来个烙印 牛皮一吹 到处招兵买马 每个烙印再各自招一堆烙印,exponential growth, 一会就用完了。
人家拍拍屁股拿着资历找更好的地方继续吹


我们上上层领导是个烙印,嘴巴一张 牛皮吹一个小时 烦死他了,都巴不得他赶紧另找高就。神烦!
y
yurik
我昨天听一个podcast 分析这个担忧,假设美国的头部模型还是最好的,但是要花$$$$$,中国的模型稍差一丢丢,但是只花$$$,那其他国家投资AI,比如印尼,菲律宾,这样的,就要好好想想为什么需要花大价钱买美国的不买中国的。所以中国这时候抢占市场先机还是挺有意义的。另外听说阿里的模型也非常不错了
yangbuhui 发表于 2025-01-23 17:31

中国制造在过去20多年里不断重复的一种最容易成功的策略,就是先靠抄、低价劳动力、政府补贴等多种因素做到原版80%的性能,但价格只有1/5甚至1/10,先把原版挤垮了再自己迭代新产品卖更高的价格。
m
meftw
Namama 发表于 2025-01-23 17:18
中美科技战打的那么厉害。。 双方各自都投入了上万亿美元竞争。。
然后搞开源造福人类,把自己最先进的算法思路给公开了?
难以理解。。

中美科技战一点不激烈,美国目前为止底裤都输没了。双方实力对比类似两国乒乓球水平的差距
m
minqidev
回复 44楼 的帖子
错了,最近很多的突破并不是国家投入。 是中国近30年的填鸭式教育的厚积薄发。
大家一直都鄙视高考,但是高考却刷选出了80后90后聪明的人,而且是公平的筛选。
这次deepseek并不是高投入的结果,就是一群聪明的人顺便做出来的东西。 以前,因为美国的开放,这些人原本要出国的,只是这几年国际形势不好,他们恰巧留在了国内。
中芯的老总就说过,其实美国搞芯片色60%都是中国人和台湾人,只是做得早而已。 只要高考不变成美国这种推荐申请制,那么中国科技就不会差
m
minqidev
回复 42楼 Namama 的帖子
Deepseek的意义告诉大家最重要的是人才培养。 看国内各行各业新成果不断。真没啥担心。 只要高考不取消,就没问题
p
pangapang
美国做啥都贵
拜建国
Namama 发表于 2025-01-23 20:52
理论上是如此,但美国现在对中国是各种封锁。。 OpenAI也闭源了,Meta也搞伪开源。。 这种背景下,Deepseek这种单方面的公开,岂不是很吃亏?
特别是他们这个算法上的突破,是有效打破美国对华芯片/算力封锁的最大武器之一。。 结果就这样主动公开了,太亏了。。


它本来就是基于llama的优化,怎么可能不开源
n
narrowgate
为啥开源?屁股决定脑袋啊
管你国家博弈,作为一个新公司,怎么在AI赛道里证明自己,而且拿到credibility? 没有比开源更快速更便宜的方法了。而且AI只是人家的副业,开源了又怎么样。
国家博弈?那不是一个个人和公司应该考虑的东西。 否则,干嘛不把模型献给国家 为啥?因为我真的有一头牛。 正常人都会这么想。
拜建国
yurik 发表于 2025-01-23 21:14
中国制造在过去20多年里不断重复的一种最容易成功的策略,就是先靠抄、低价劳动力、政府补贴等多种因素做到原版80%的性能,但价格只有1/5甚至1/10,先把原版挤垮了再自己迭代新产品卖更高的价格。

中国人聪明,善于模仿学习,而且还特别勤奋,不善于原创但是擅长基于原创搞优化。美帝搞开源其实就是作死。
d
dodgers
Namama 发表于 2025-01-23 17:17
这和广告没啥关系吧? 美国各大厂的AI,对中国都有各种封锁限制。。
中美AI科技战打的那么厉害,现在两边是分开的不同市场
DeepSeek开源比Meta更加彻底。。 而且他这里的关键就是思路,把这个公布了,具体参数的调制其实只要堆人堆资源就能解决,不难的。。


不开源大家不相信,没人用。
开源了,可以被验证。
e
eda2k4
yurik 发表于 2025-01-23 21:14
中国制造在过去20多年里不断重复的一种最容易成功的策略,就是先靠抄、低价劳动力、政府补贴等多种因素做到原版80%的性能,但价格只有1/5甚至1/10,先把原版挤垮了再自己迭代新产品卖更高的价格。

中国从来都是把原版挤垮了再自己迭代新产品卖更低的价格
m
minqidev
中国从来都是把原版挤垮了再自己迭代新产品卖更低的价格
eda2k4 发表于 2025-01-23 22:44

, 其实国内,类似于deepseek得团队,同一个水平得都可能有十多个。
昨天,kimi还出了一个版本,比deepseek得更厉害,而且还把详细得训练步骤写成了论文。 现在目前属于人才井喷。而且,最近十年,很多年轻学者回去了。那么多又年轻又厉害的人凑一起,很容易出结果。
在美国,哪怕一个deepseek水平的团队,因为IT薪水虚高,平均每个人就要100,200万美元的年薪,这个是大牛,那个是大牛学生,造成了很多厉害的人很难凑到一起。 稍微有点成绩,资本一哄而上,几百亿美元一砸,更难让优秀的人聚到一起了。

yangbuhui 发表于 2025-01-23 17:31
我昨天听一个podcast 分析这个担忧,假设美国的头部模型还是最好的,但是要花$$$$$,中国的模型稍差一丢丢,但是只花$$$,那其他国家投资AI,比如印尼,菲律宾,这样的,就要好好想想为什么需要花大价钱买美国的不买中国的。所以中国这时候抢占市场先机还是挺有意义的。另外听说阿里的模型也非常不错了

机器人机器狗也是这样,功能差不多,也许精确度稍微差一点,中国的价格低好几倍,而且更新换代特别快,最近被推送了一个宇树的直立机器人视频,走路是模仿人类的自然步态,能在斜坡上上下奔跑,平衡控制的很好。Boston Dynamics似乎近几年都没有太大的进步
C
C999
风轻雨 发表于 2025-01-23 17:49
开源对中国有利,吸引大家都跑到中国的平台上开发

开源,本来就是一种商业策略,一种盈利模式。

c
custom
minqidev 发表于 2025-01-23 22:54
, 其实国内,类似于deepseek得团队,同一个水平得都可能有十多个。
昨天,kimi还出了一个版本,比deepseek得更厉害,而且还把详细得训练步骤写成了论文。 现在目前属于人才井喷。而且,最近十年,很多年轻学者回去了。那么多又年轻又厉害的人凑一起,很容易出结果。
在美国,哪怕一个deepseek水平的团队,因为IT薪水虚高,平均每个人就要100,200万美元的年薪,这个是大牛,那个是大牛学生,造成了很多厉害的人很难凑到一起。 稍微有点成绩,资本一哄而上,几百亿美元一砸,更难让优秀的人聚到一起了。


中国俨然AI大国了,这一个个冲锋队,要把大模型玩烂的节奏,很像当年的淘金热
y
yurik
机器人机器狗也是这样,功能差不多,也许精确度稍微差一点,中国的价格低好几倍,而且更新换代特别快,最近被推送了一个宇树的直立机器人视频,走路是模仿人类的自然步态,能在斜坡上上下奔跑,平衡控制的很好。Boston Dynamics似乎近几年都没有太大的进步
莱 发表于 2025-01-23 23:07

从gopro到扫地机器人到宇树机器狗之类的产品都是这样,中国公司看到美国公司从0到1的突破后开始仿造,推出1/10价格的产品,迭代速度还比原版快,原版几年后直接关门或苟延残喘。gopro和iRobot之类的厂家一开始风光过,现在都只剩一口气了。 刚查了一下比较新的数据,不保证准确,宇树最便宜的机器狗大概$1600,波士顿动力最便宜的机器狗$15000,价格刚好差10倍(没有仔细对比性能)。
l
layjohns
yurik 发表于 2025-01-24 00:35
从gopro到扫地机器人到宇树机器狗之类的产品都是这样,中国公司看到美国公司从0到1的突破后开始仿造,推出1/10价格的产品,迭代速度还比原版快,原版几年后直接关门或苟延残喘。gopro和iRobot之类的厂家一开始风光过,现在都只剩一口气了。 刚查了一下比较新的数据,不保证准确,宇树最便宜的机器狗大概$1600,波士顿动力最便宜的机器狗$15000,价格刚好差10倍(没有仔细对比性能)。

波士顿动力走的是液压路线, 宇树一开始就是电驱。好像现在波动也改走电驱了
y
yurik
回复 44楼 的帖子
错了,最近很多的突破并不是国家投入。 是中国近30年的填鸭式教育的厚积薄发。
大家一直都鄙视高考,但是高考却刷选出了80后90后聪明的人,而且是公平的筛选。
这次deepseek并不是高投入的结果,就是一群聪明的人顺便做出来的东西。 以前,因为美国的开放,这些人原本要出国的,只是这几年国际形势不好,他们恰巧留在了国内。
中芯的老总就说过,其实美国搞芯片色60%都是中国人和台湾人,只是做得早而已。 只要高考不变成美国这种推荐申请制,那么中国科技就不会差
minqidev 发表于 2025-01-23 21:37

明显不懂这个行业,就别胡扯了。DeepSeek是founder有钱以后追逐梦想,专门买卡招人研究大模型,不是“顺便”做出来的东西。清华北大理工科又不是所有人都出国,总有人“恰好”留在国内,不用甩锅给国际形势。 DS的成功离不开囤的卡,不多但刚好够用。学术界的聪明人不少,但只能拿几卡做实验,实在是巧妇难为无米之炊,只能水论文或转行拼周边赛道(inference、evaluation dataset等)。
n
neolith2000
nickbear 发表于 2025-01-23 17:08
开源的只是模型参数,train的细节肯定有保留 deepseek开源主要是为了打广告 因为大厂和openai已经把服务市场占了 一个后来者想打出名声,开源让大家自己验货是最简单有效的方法 从结果来说效果也很好,关注大大增加,投资也来了


deepseek的论文都写了,一步步教你怎么训练这个模型
m
minqidev
明显不懂这个行业,就别胡扯了。DeepSeek是founder有钱以后追逐梦想,专门买卡招人研究大模型,不是“顺便”做出来的东西。清华北大理工科又不是所有人都出国,总有人“恰好”留在国内,不用甩锅给国际形势。 DS的成功离不开囤的卡,不多但刚好够用。学术界的聪明人不少,但只能拿几卡做实验,实在是巧妇难为无米之炊,只能水论文或转行拼周边赛道(inference、evaluation dataset等)。
yurik 发表于 2025-01-24 00:43

deepseek的团队主要是作量化的,这才是他们有钱买显卡的原因。 什么部门有这么多钱买显卡? 一个用数据投资金融的,还有一个就是挖矿的。他们总共有2万张H100, 其实也不少,相当于特斯拉最大一个集群的一半。其实也不多,很多挖矿的,有几仓库的网卡在吃灰。以前还要东躲西藏,因为挖矿毕竟还是灰色收入。现在去发展AI,不但电费有政策,顺便挖矿,上面也是睁一只眼闭一只眼
为什么他们有底气开源,源头是他们真正服务的部门有钱。如果,集合一帮忙专门研发这个,没有利润,根本进行不下去的。 为什么有底气开源,国内这种级别的也不少,大家都很厉害。
n
neolith2000
莱 发表于 2025-01-23 23:07
机器人机器狗也是这样,功能差不多,也许精确度稍微差一点,中国的价格低好几倍,而且更新换代特别快,最近被推送了一个宇树的直立机器人视频,走路是模仿人类的自然步态,能在斜坡上上下奔跑,平衡控制的很好。Boston Dynamics似乎近几年都没有太大的进步

中国做机器狗的不止一家,还有一家云深处,和宇树的水平差不多
n
neolith2000
yurik 发表于 2025-01-24 00:43
明显不懂这个行业,就别胡扯了。DeepSeek是founder有钱以后追逐梦想,专门买卡招人研究大模型,不是“顺便”做出来的东西。清华北大理工科又不是所有人都出国,总有人“恰好”留在国内,不用甩锅给国际形势。 DS的成功离不开囤的卡,不多但刚好够用。学术界的聪明人不少,但只能拿几卡做实验,实在是巧妇难为无米之炊,只能水论文或转行拼周边赛道(inference、evaluation dataset等)。

DeepSeek的founder原来做挖矿的,手里有一大批显卡,后来顺便转型搞大模型
m
minqidev
neolith2000 发表于 2025-01-24 00:53
中国做机器狗的不止一家,还有一家云深处,和宇树的水平差不多

对,很多人就想当然,随便降价就行了。 其实,降价的原因是,国内整条产业链都挤满了,各方面都非常成熟才顺势降价的。
y
yurik
deepseek的论文都写了,一步步教你怎么训练这个模型

neolith2000 发表于 2025-01-24 00:49

大部分是基于公开的模型架构和算法,比如MoE和PPO等,好像GRPO和MLA两个优化方案是DS原创的。DS厉害的地方在于找到了有限资源能训练出的最佳(已知的)模型配置,说明实验效率极高。对比之下meta的researcher对GPU资源的利用效率明显太低。 不过最重要的其实是训练数据,ds没给,llama也没给,其它任何公司都不会公开,包括mistral这种非赢利性机构。这其中有各方面原因,最主要的应该是总有无法见光的数据。
y
yurik
DeepSeek的founder原来做挖矿的,手里有一大批显卡,后来顺便转型搞大模型

neolith2000 发表于 2025-01-24 00:54

founder在大学里是学人工智能的,量化挖矿这些是赚钱手段,梦想一直是AGI
m
minqidev
yurik 发表于 2025-01-24 00:57
大部分是基于公开的模型架构和算法,比如MoE和PPO等,好像GRPO优化方案是DS原创的。DS厉害的地方在于找到了有限资源能训练出的最佳(已知的)模型配置,说明实验效率极高。对比之下meta的researcher对GPU资源的利用效率明显太低。 不过最重要的其实是训练数据,ds没给,llama也没给,其它任何公司都不会公开,包括mistral这种非赢利性机构。这其中有各方面原因,最主要的应该是总有无法见光的数据。

这不是不愿意给,是给了要吃官司。
m
minqidev
yurik 发表于 2025-01-24 01:00
founder在大学里是学人工智能的,量化挖矿这些是赚钱手段,梦想一直是AGI

,你是搞财经新闻的把。 其实不管你是学什么的,原本就没AGI这个东西,AGI是一种商业模式对AI的一种幻想。
y
yurik
,你是搞财经新闻的把。 其实不管你是学什么的,原本就没AGI这个东西,AGI是一种商业模式对AI的一种幻想。
minqidev 发表于 2025-01-24 01:03

你这些乱七八糟的二手观点哪看来的……AGI居然成商业模式了 先读下wiki吧:https://en.wikipedia.org/wiki/Artificial_general_intelligence
m
minqidev
yurik 发表于 2025-01-24 01:04
你这些乱七八糟的二手观点哪看来的……AGI居然成商业模式了 先读下wiki吧:https://en.wikipedia.org/wiki/Artificial_general_intelligence

对啊,你随便问一个真正搞AI的,很多人会告诉你没AGI这个东西,只有投资的人会渲染这个目标。
m
minqidev
你这些乱七八糟的二手观点哪看来的……AGI居然成商业模式了 先读下wiki吧:https://en.wikipedia.org/wiki/Artificial_general_intelligence
yurik 发表于 2025-01-24 01:04

我说了你就是看一些财经新闻。就是一些投资者,设立一个好听的名字而已。
https://www.youtube.com/watch?v=0jMgskLxw3s 26:10 - What does “AGI” (artificial general intelligence) really mean?
a
anw
nickbear 发表于 2025-01-23 17:08
开源的只是模型参数,train的细节肯定有保留 deepseek开源主要是为了打广告 因为大厂和openai已经把服务市场占了 一个后来者想打出名声,开源让大家自己验货是最简单有效的方法 从结果来说效果也很好,关注大大增加,投资也来了


给个 API 也可以验货。OpenAI 怎么验货的
y
yurik
minqidev 发表于 2025-01-24 01:06
对啊,你随便问一个真正搞AI的,很多人会告诉你没AGI这个东西,只有投资的人会渲染这个目标。

鉴定完毕,你被号称“真正懂AI”的人骗了,然后觉得自己也懂了。我说的你当然不信,可以搜搜Yan Lecun和Ilya Sutskever的推里有没有提到AGI。当然也许告诉你这个的人伽位比他们还大 lol
a
anw
olivia0216 发表于 2025-01-23 17:22
软件没办法闭源,毫无意义
只要核心成员被挖跳槽,分分钟复制一个。
软件公司那么多,大都靠不断融资,很多根本没法盈利

微软从70年代到现在,快50年了,一直在盈利
m
minqidev
鉴定完毕,你被号称“真正懂AI”的人骗了,然后觉得自己也懂了。我说的你当然不信,可以搜搜Yan Lecun和Ilya Sutskever的推里有没有提到AGI。当然也许告诉你这个的人伽位比他们还大 lol
yurik 发表于 2025-01-24 01:10

( ̄▽ ̄)", 提到AGI,就是想要钱而已。这是事实。大概就是10多年前, 当时觉得AI赚的钱太少了,那就来个AGI。 我在15年前也是神经网络和图像的, 当然我比较菜拉,但不妨碍我目睹AI的发展。
很少有什么人为了一个AGI目标区建立啥,其实国内很多搞AI的一个梦想,可能就是挖更多的矿,或者移除小电影的马赛克, 或者更简单的让AI有自学能力什么的。
y
yurik
给个 API 也可以验货。OpenAI 怎么验货的
anw 发表于 2025-01-24 01:10

验证模型推理效果很容易,但没有训练数据,确实无法完全验证训练过程中的细节。 自己跑通MLA、GRPO,验证一下infra性能参数,和自己的模型指标大概确实能提升,这些都没问题,但肯定无法完全复现R1。 除了数据,训练过程确实可能有些secret sauce。
y
yurik
( ̄▽ ̄)", 提到AGI,就是想要钱而已。这是事实。大概就是10多年前, 当时觉得AI赚的钱太少了,那就来个AGI。 我在15年前也是神经网络和图像的, 当然我比较菜拉,但不妨碍我目睹AI的发展。
很少有什么人为了一个AGI目标区建立啥,其实国内很多搞AI的一个梦想,可能就是挖更多的矿,或者移除小电影的马赛克, 或者更简单的让AI有自学能力什么的。
minqidev 发表于 2025-01-24 01:17

所以“提到AGI,就是想要钱而已”只是你个人看法而已,在真正干这一行的人面前,就没必要包装成大佬背书过的观点了。