挑战波士顿动力,人形机器人卷到了硅谷

今日头条
Toutiao
最新回复:2025年7月3日 0点5分 PT
  返回列表
41550 阅读
2 评论
腾讯科技

K-scale大概符合你对一家硅谷初创公司的全部想象。在北加州耀眼的阳光下,一群年轻的工程师正聚在车库里,顶着睡眼惺忪的蓬松发型,手指却在键盘上快如闪电,一行行代码在屏幕上飞速滚动。

电脑桌旁,几罐昨晚团队派对后留下的空啤酒瓶东倒西歪,周围是凌乱摆放的机械臂、持续工作的3D打印机、以及各种缠绕的数据线、充电线。空气中,似乎到处弥漫着焊锡、咖啡与梦想混合的味道。

忽然,一名工程师略带沙哑却异常兴奋的嗓音划破了键盘的敲击声:“准备好了吗?倒计时:三、二、一!”

众人的目光齐刷刷投向车库中央一台原本静默无语、略显无精打采的机器人。仿佛一道无形的指令激活了它的核心,机器人身上的指示灯骤然亮起。它先是僵硬地动了动“手臂”,接着试探性地伸了伸“腿”,在一片屏息的期待中,它摇摇晃晃、却又无比坚定地,迈出了载入团队日志的第一步。尽管姿态尚显稚嫩,但这“一小步”,对K-scale Lab而言,却是奔向未来的一大步。

这个在旁人看来如同火箭发射般激动人心的过程,被工程师们称为“Deploy”(部署)。其精髓,就是将事先在软件中通过强化学习算法模拟、迭代了无数次的机器人动作与决策场景,“灌注”到实体机器人中,让它在复杂多变的现实物理环境中,也能复现出与软件模拟中几乎完全一致的各种动作。

K-scale Lab,这家成立尚不足一年的硅谷机器人新锐力量,正是在这样一次次的“部署”与迭代中,迈进他们宏大的愿景:打造一个真正开源、普惠的软硬件一体的机器人平台。

强化学习路线的坚定拥趸

硅谷的空气中,人工智能的浪潮正以前所未有的强度席卷一切。然而,对于K-scale Lab的联合创始人兼首席运营官徐睿而言,未来并非仅仅存在于云端的算法。他所畅想并为之奋斗的,是能真正行走于物理世界、用近似孩童学步般的“笨拙”与“智能”不断进化的具身智能体。而驱动这一切的,是他和团队对“强化学习”(Reinforcement Learning, RL)近乎孤注一掷的信仰。

“我们是百分之百、完完全全用强化学习来做整个机器人的运动控制。”徐睿的语气带着不容置疑的坚定,“我们团队现在九个人,绝大部分都是搞强化学习的工程师,我是现在公司唯一不写代码的人。”徐睿笑着说,“不过这也意味着,所有技术、工程之外的事都是我来负责。”

这不仅仅是一个技术路径的选择,更像是一种底层哲学的坚持。放眼全球,众多人形机器人公司仍在沿用传统的运动规划(Motion Planning)方法,通过精确的数学模型预设机器人的每一步动作。但K-scale Lab的团队,却选择了一条截然不同的“少有人走的路”。

“我们不做任何传统的运动控制,全部都是用强化学习。”他解释,传统方法在面对动态变化的环境,比如突然一阵妖风,或者地面一块意想不到的凸起时,往往显得捉襟见肘,稳定性不足。而强化学习,则被他们寄予了实现更强泛化能力的厚望。

这种方法的理念听起来颇有几分“大道至简”的意味,执行起来却艰深无比。想象一下教一个婴儿走路,你不会为他编写每一块肌肉如何收缩的指令,而是设定目标:别摔倒、往前走、左右腿交替。K-scale Lab团队做的,正是类似的事情——为机器人定义一套“奖励函数”(Reward Function)。“比如说,我们设定机器人不能倒、双腿必须交替前进、不能原地蹦跳,并且要保持一定的速度往前走。”机器人便在一次次模拟环境中的跌倒与爬起中,摸索着如何最大化这些“奖励”,最终“学会”行走。

对强化学习的选择,也深刻影响了他们的硬件选型。

“我觉得液压系统一定不会是未来的方向,因为它没办法很好地支持强化学习。”徐睿的这番话,无疑是对波士顿动力这类以液压驱动闻名的行业前辈提出了含蓄的挑战。

在他看来,电动马达,尤其是那些受益于电动汽车技术进步的关节马达,才是当下更优的选择。

“这一波人形机器人为什么能重新火起来?不就是因为有了强化学习嘛!”他反问道,点出了技术迭代的核心驱动力。

正如许多人所判断的那样,机器人创业的兴起,来源于三方面作用的共同促进:以Transformer架构为基础的大语言模型(LLM)和多模态模型,向全世界展示了通用人工智能的惊人潜力,也为机器人赋予更强的决策能力提供了可能。其次是硬件产业链的成熟,得益于电动汽车产业链的飞速发展,高性能的伺服电机、传感器和电池技术成本不断下降,为制造更灵活、更高效的机器人奠定了基础。最后,资本的躁动,在目睹了OpenAI等为代表的生成式人工智能的巨大成功后,资本的嗅觉正从纯粹的通用AI算法,转向能与物理世界深度交互的“硬核科技” 。

“极客”先锋队:让人形机器人踏入寻常爱好者家

这样一款几乎完全依赖“自主学习”的先进机器人,它的第一批用户会是谁?出人意料的是,并非人们通常想象的工厂流水线,也不是高端的科研机构,更不是普通的家庭消费者。K-scale Lab团队倾力打造的首款大型人形机器人,拥有24个自由度,定价却控制在极具吸引力的1万美元以内,其目标用户,是美国市场上那群充满热情的“Geek”(极客/爱好者)。

“我们就希望,这个东西首先是卖给真正的爱好者,让他们买回家去玩,去折腾。”徐睿描绘着他的用户画像。他希望这些极客们拿到机器人后,能像对待一台开放的电脑一样,自己编程、自己训练,让机器人学会整理房间、跳一支搞怪的舞,甚至完成更多天马行空的自定义功能。

这不仅仅是一个巧妙的市场切入策略,更是团队深思熟虑的数据积累计划。徐睿坦言,强化学习目前最大的瓶颈在于“数据量不足”。

“现在RL的天花板就是数据,机器人的有效交互数据实在太少了。”不同于可以吞噬整个互联网文本的语言大模型,机器人的学习更依赖于真实物理世界的互动数据。通过将机器人率先投放到最具创造力和动手热情的爱好者手中,他们期望能催生出海量、多样化的使用场景和数据,反哺模型的迭代。

除了这款“大块头”,一款售价约1000美元的小型机器人也已在紧锣密鼓地筹备中。其潜在客户群体,是那些希望孩子通过参与前沿科技项目来提升大学申请竞争力的高中生家长。市场的热情超乎想象,据徐睿透露,这款小型机器人已经收到了高达2万份的购买意向注册。

尽管初期聚焦爱好者,但徐睿的目光显然更为长远。他相信,随着技术的成熟和数据的积累,产品的功能会逐渐泛化,渗透到更多实用场景,比如实现简单的听写、打扫等。同时,他们也关注着行业和学校市场,认为现有教育机器人在软件开放性和技术支持方面,仍有巨大的提升空间。

软硬一体的坚持与开源社区的灵魂:ksim的诞生

“像我们这样,既做硬件又做软件,而且是深度结合的公司,在美国其实不多,很多是只做软件或者AI训练。”徐睿点出了团队的核心竞争力之一。他们坚信,硬件的物理性能与软件的智能算法必须深度耦合,才能发挥出人形机器人的最大潜力。在硬件开发上,他们有三个核心评价标准:可用性(能流畅实现基本动作)、健壮性(皮实耐用,不易损坏)和成本效益(价格亲民)。

徐睿过往曾在中美多家科技大厂有着丰富的从业经历,尤其是在智能硬件领域方面的积累,让他对中美两国在信息密度和创新环境方面的特质有了更深的理解,认为这两者是“当前全球信息最密集、最适合进行机器人和AI开发的地方。”

在制造方面,团队最初的计划是依托中国成熟的供应链体系——例如,机器人灵巧的手部便采用了国内供应商的成熟产品。

然而,复杂的地缘政治因素让他们不得不未雨绸缪,开始考虑将生产线转移到东南亚,甚至在美国本土建厂的可能性。

“我觉得美国现在的制造业人才储备确实是个问题,”徐睿不无忧虑地表示,“很多老师傅都老去了,年轻一代的制造经验出现了断层。”他甚至半开玩笑地感叹:“美国的‘梦’(指成本)不够低啊!”

而比硬件制造本身更彰显K-scale Lab开放决心的,是他们对“开源”的极致追求。他们不仅理念开放,更付诸实践,高调发布了名为‘ksim’的开源Python库,目前已经经过了超过60次的更新迭代,这个强大的工具基于谷歌的MuJoCo物理引擎和JAX高性能计算库构建,旨在为全球的开发者社区提供一个便捷高效的机器人测试平台。

通过ksim,开发者可以方便地进行强化学习模拟训练,“在模拟器中一遍遍地跑,直到满意为止”,不断迭代优化算法,最终将训练成熟的模型“一键部署”到真实的K-scale机器人上,进行实际场景的严苛测试与验证。这不仅大大降低了机器人AI开发的门槛,也真正体现了他们“希望人人皆可参与”的开源精神。

社区,是这家公司版图中的另一块重要基石。在社交平台Discord上,他们已经聚集了一个数千人的活跃社群,成员背景各异,有资深爱好者、高校学生,也有充满好奇心的教师。这些社区成员不仅是产品的潜在用户,更是积极的测试者和共建者,利用ksim等工具探索各种可能,甚至有人利用3D打印等工具,自制机器人硬件来适配团队的开源软件。

一位来自阿里的员工,凭借着对项目公开信息的琢磨,竟然成功复刻了他们的机器人设计,这让K-scale Lab团队既惊讶又欣慰。

这种彻底的开放性和活跃的社区运营,被徐睿视为区别于其他机器人公司的“护城河”,尤其不同于国内一些“号称开源但实际上核心技术和零部件难以复制”的项目。

“国内很多公司都说自己开源,但坦白讲,他们那个‘开源’,是全世界除了他们自己,没有任何第二个人能把那套东西完整复现出来的。”徐睿说。

当然,选择开源也意味着要承担其固有的“不确定性”。“我们从去年11月份就开始‘跳票’(产品延期),”徐睿坦诚地解释道,“跳票的原因,说白了,就是因为我们所有工具链都是开源的,而开源工具链最大的问题,就是有时候不太靠谱。”然而,这份对开放的坚持,源于他们对社区力量和长远价值的笃信。

在传感器方案上,他们也体现了RL优先的思路,主要依赖视觉和IMU(惯性测量单元),而没有采用在机器人领域广泛应用的激光雷达(LiDAR)。

“我们的RL算法是基于视觉和重力传感器的,你就算装了激光雷达,对我们这套系统来说也没用。”这既是出于成本的考量,也与特斯拉等公司推崇的端到端学习理念不谋而合。

年轻的“特种部队”、特斯拉基因与资本风向之变

驱动这一切的,是一支仅有9人的精干团队,成员大多是背景深厚的强化学习工程师,洋溢着年轻人的活力与锐气。

更引人注目的是,徐睿透露,团队的另一位联合创始人,曾是特斯拉FSD(完全自动驾驶)V12版本的核心成员。

“现在你说你是做AI的,投资人可能就‘哦,好吧’;但如果你说你要进场(指制造业、硬科技),所有投资人的眼睛都会‘噌’地一下亮起来,恨不得马上把钱投给你!”资本的嗅觉,似乎正从纯粹的通用AI算法,转向能与物理世界深度交互的“硬核科技”。

公司目前已经顺利完成了天使轮融资,金额约不到500万美元,投资方主要来自美国。团队的组建方式也充满了硅谷特色,不少成员是从活跃的社区中招募而来,先以短期合同(Contractor)的形式合作,在实际项目中考察能力与契合度,表现优异者再转为正式员工。

徐睿笑言,这与互联网行业的崛起颇为相似:“当前机器人和AI领域,真正能打的,也大多是年轻人。”

K-scale Lab目前的“大本营”,其选择本身也充满了硅谷式的传奇与务实。这家目前总共不到10人的精锐团队,并未选择传统的办公园区,而是租下了一栋位于阿瑟顿(Atherton)的五卧室独栋豪宅。阿瑟顿,这个名字在硅谷乃至全美都意味着顶级地段,常年占据最昂贵邮编的榜首。

他们为这栋市场估值约1500万美元的豪宅支付的月租金高达2万美元左右,而房子的主人,传闻是PayPal早期的一位副总裁。

听起来有些不可思议的“奢侈”?但在寸土寸金、创业成本高昂的硅谷,对于K-scale Lab这样规模的初创团队而言,这反而是一笔经过深思熟虑的“划算”账。

创始人团队与早期员工们,索性将生活与工作彻底融合——楼下客厅、车库变成了堆满电路板、3D打印机和机器人原型的“战场”与实验室,楼上的卧室、宽敞的后院则是他们短暂休憩的“港湾”。这样的安排,不仅直接省下了一笔数目不菲的独立办公空间租赁费用,更重要的是,团队成员几乎24小时同吃同住同工作,无论是餐桌旁突如其来的头脑风暴,还是深夜实验室里并肩解决技术难题,都极大地提升了沟通效率与工作产出。

地处硅谷腹地,还有一个得天独厚的优势,那就是相关人才遍地都是。徐睿说,K-scale距离斯坦福大学仅几分钟车程,遇到什么难题,随便在某个周末,就能招呼来几个斯坦福的学生,大家三下两下,就把事情给搞定了。

特斯拉的启示、中国硬件的实力与“伪开源”的困境

作为局内人,徐睿对机器人行业的现状与未来,有着自己独到的观察。他认为特斯拉FSD V13版本在端到端强化学习路线上取得了“巨大进展”,其“丝滑流畅”的体验,雄辩地证明了RL路线的巨大潜力。虽然他也承认RL“肯定是有天花板的”,但他补充道,“至少目前,我们还没看到这个天花板在哪里。”

对于激光雷达等传统传感器路线,他则持保留态度,认为其成本高昂且可能并非长久之计。谈及全球竞争格局,他坦承中国在人形机器人硬件方面的水平“相当可观”,以宇树科技等公司为例,“甚至不一定比波士顿动力差。”这种对中国硬件实力的认可,也是他们希望在国内寻找合作伙伴的原因之一,“毕竟你看Hugging Face上,大概40%的模型是中国贡献的。”

然而,正如前文所述,他对国内部分企业在开源方面的“名不副实”颇有微词。在美国,他观察到公司间的竞争态势有所不同:“美国公司之间的技术壁垒相对较低,竞争更多在于运营、策略和团队执行力,而非单纯的技术封锁。”

当被问及人形机器人在工厂的应用前景时,徐睿的回答显得相当务实:“我觉得工厂里最适合的还是机械臂和传送带,真不一定非得是‘人形’这个形态。”这份清醒,也反衬出他当前聚焦爱好者市场、着眼于RL长期适应性潜力的战略定力。

数据、梦想与人形机器人的破晓

徐睿和他的团队,这家名为K-scale Lab的初创公司,正以一种“新物种”的姿态,闯入人形机器人的江湖。他们一手紧握强化学习的利剑,一手高擎开源社区的火把(以ksim库为代表),试图破解机器人领域“数据诅咒”的难题。小型机器人收获的两万份购买意向,以及社群中自发复刻设计的“铁杆粉丝”,无不印证着这条道路的独特魅力。

徐睿坚信,美国华人在AI和机器人领域的卓越表现,也预示着中国在这一领域拥有巨大的追赶和超越潜力。

前路依然漫漫。算法的持续优化、全球供应链的整合与挑战、社区生态的维护与拓展,每一项都是横亘眼前的巨大考验。因开源工具链的“不靠谱”而导致的“跳票”,只是这条创新长征路上的一个小插曲。

然而,正是这种对强化学习的极致信仰,对“人人皆可参与”的开放精神的执着,让这个年轻团队的故事充满了张力。

正如徐睿在谈论双足行走的高难度时所言:“做人形机器人,难度堪比‘造人’,你看狗狗四个腿跑起来,容错率就高很多,两条腿的容错,还是差了不少。”也正是这份对挑战的无畏,对学习与适应的极致追求,定义了他们这趟征程的非凡意义。

在人形机器人技术探索的多元路径中,K-scale Lab这样的小型初创公司,以其对强化学习的专注、对软硬件一体化的坚持以及对开源社区的拥抱,展现了一种独特的尝试。

作为一个刚刚起步的团队,他们能否有效地将前沿的AI技术与相对低成本的硬件相结合,为爱好者和早期开发者市场带来真正可玩、可用的产品,并在这一过程中验证其技术路线的可行性与成长性,是行业内一个值得关注的探索案例。

无论K-scale Lab未来的商业版图如何,其在强化学习应用于机器人控制、以及构建开放式软硬件生态方面的实践,都可能为后续的机器人创业者和研究者提供有价值的经验或教训。对于关注机器人领域创新模式和技术落地的人们来说,这家小公司的每一步尝试,都是观察行业发展趋势、理解技术挑战与机遇的一个鲜活样本

据说据说
1 楼
世界上还没有任何公司有能力挑战波士顿动力。
t
tiger500
2 楼
波士顿动力早已被美军方抛弃,打包卖给三星了。