AI进入数据时代,以META收购Scale AI说起, 特斯拉和 x 的数据严重低估

B
BrightLine
楼主 (文学城)

Meta 昨天正式宣布:以 148 亿美元收购数据标注公司 Scale AI 近 49% 的股份,同时任命其 25 岁的创始人 Alexandr Wang 为 Meta 新设立的“超级智能实验室”负责人。

很多人觉得贵,其实他们买的不是“外包劳务”,而是 AI 智能上限的决定权——高质量标注数据的控制权。

Scale AI 现在有 30 万训练有素的标注员,客户包括 OpenAI、特斯拉、微软、美国国防部等。Meta 的收购,相当于把整个 AI 行业的“粮仓”装进了自家后院。模型和算力可以买,但真正能训练出差异化智能的,是“调教过的数据”。

这事儿我看的很重,甚至可以说,它标志着AI行业“权力转移”的开始。

数据才是下一场战争的制高点

过去一年大家都在卷:谁的 GPU 多,谁的 Token 强,谁的 LLM 参数大。但 Meta 这一笔交易告诉我们:真正的胜负手已经转移到“谁掌握了原始高质量训练数据”上了。

数据标注,不是搬砖,而是人工智能时代最稀缺的“认知资产”。

一个顶尖肿瘤医生花几个小时标注的医学影像,其实价值比 GPU 还贵。Web3 项目 Sahara AI 就在尝试用 Token 来重新分配这部分价值,而不是几十美元一张图的廉价买断。未来真正实现 AI 价值的,是数据分配权,而不是算力租赁权。

特斯拉和 x 的数据或严重低估

Meta 花 148 亿只买了半个 Scale AI,那我们来看看马斯克手里那两个“数据油田”值多少钱?

FSD 自主驾驶影像 + 用户驾驶行为数据

x(前 Twitter)的全球语言、观点、互动、实时事件数据

这些不是“垃圾语料”,是训练多模态通用智能(AGI)的最强语义资产池。如果未来 AI 真走向数据为王的格局,特斯拉和 x 的“数据内含价值”可能远高于市场当前估值给它们的分部加总。

Meta 在下很大一盘棋

看看 Meta 最近几年的布局:

Llama 开源模型体系

Quest 头显硬件与 MR 平台

Threads 对标 Twitter 的社交语言语料池

现在又加上了 Scale AI 这个数据入口

这是一整条从“模型 → 输入端 → 数据训练源”的闭环。它不再是社交公司,是“AI 基础设施巨头”,未来有点像 AI 界的 Google + Android + AWS 的混合体。

一句话总结:

 GPU 是汽油,模型是引擎,但谁拥有数据,谁就拥有“油矿权”。

Meta 这一招砸下去,标志着 AI 从“拼硬件”进入“争资源”,

从“跑分模型”进入“争认知资产”。

Web2 巨头用金钱筑起数据围墙,Web3 想用激励机制打破它。未来谁赢我不知道,但至少方向已经变了。

风险自负,打脸不管。想想你手上那几只股票,是“拥有算力”,还是“控制数据”?这差别可能就是未来五年十倍股和归零股的区别。

越王剑
Meta 2019年抢了不少AI人才

因为要做虚拟界。现在直接转入AI。AI本身就是数据。看看Matrix, 都是数据组成地。哈哈。

得数据者得天下。

 

b
bogbog
“得数据者得天下“, exactly
A
Artspace87
谢分享,看来我家俩小子赶上AI浪潮,一个搞数据分析,一个搞RV/AV设计,
A
Artspace87
我一直认为Tesla终极地是AI开发,它的数据库庞大
越王剑
虽然有数据,还得去开发

一龙热心搞政治,其它就耽误了。政治这东西有啥意思啊?呵呵。

名校FAN
赞!我家俩个进了QT赛道,以后trade你家股票..哈哈
A
Artspace87
政治太不适合一龙了,会限制他的创造力和想象力,这次是老川惜才让他参政,以后应该不会让他参与核心决策
*
*江南雨*
还是算法是灵魂。好的干净些的数据是如虎添翼。
A
Artspace87
哈哈哈,你家俩娃已先行一步自己创业了,后生可畏啊。
名校FAN
谢谢美言,小中男的春天来了..
B
BrightLine
Next Billionaire in the making?

名校FAN
哈哈,谢谢!
品酒
非常赞同。我早就指出(不是自夸是站在主人的肩膀上)数据如同钻石,大众在各个角落奉献的数据如同当初土著人被玻璃换了钻石一样

自己却不自知。好常一段时间,我都是拒绝cookies 可是无耻商家越来越多了

绣球花开
谣言小扎的llama 4 出来大破防

对几千人的ai unit 现在不信任