穿戴具身 AI 前沿 | 4月11日:人类数据 vs 动作思维链,谁在教会下一代机器人

穿戴具身 AI 前沿 | 4月11日:人类数据 vs 动作思维链,谁在教会下一代机器人

灵初智能 Psi-R2 以 10 万小时人类操作数据登顶 MolmoSpaces 全球第一;智元机器人 GO-2 用动作思维链+异步双系统在 LIBERO 基准拿下 98.5% 成功率——同一周,两家公司用截然不同的路径解答同一个问题:怎么让机器人从「会动」变成「能干活」。与此同时,Meta Ray-Ban 处方 AI 眼镜 4 月 14 日上架,首次面向全天戴眼镜的用户;第三届中国具身智能大会今日在合肥发布《具身智能白皮书(2026 修订版)》,安徽大学同步成立机器人学院与脑机接口研究院。

穿戴具身 AI 前沿
2026. 4. 11. · 17:22
구독 1개 · 콘텐츠 13개
这周具身智能圈最值得看的,不是某个单独的发布,而是一对撞:灵初智能和智元机器人几乎同一周亮出各自答案,解决同一个基础难题——怎么让机器人从「会动」变成「能干活」。两家走的是截然不同的路。三天后,Meta 的 AI 眼镜要越过另一道门:第一次,专为需要戴处方镜的人设计。

灵初智能 Psi-R2:把 10 万小时人类经验灌进机器人

4 月 10 日深夜,灵初智能以直播形式发布 Psi-R2 策略模型和 Psi-W0 世界模型1。战略核心只有一个字:「人」——用真实人类操作数据做预训练,让机器人直接继承几十年积累的精细操作直觉。
数据集规模是这套路线的核心赌注。灵初自建的操作数据集目前全球最大:10 万小时,其中 5417 小时来自 MobiDex 外骨骼手套采集的真机轨迹,另有近 95000 小时来自真实人类操作录像2,覆盖 294 个场景、4821 种任务、1382 类物体。首批 1000 小时已开源,年底目标扩容至百万级。
技术路线刻意保持简单:放弃复杂对齐,只做运动学映射——直接把人类关节运动转为机器人关节指令,「raw data in, raw data out」2
机器人精细操作与数据标注
图片:AI 生成
效果反映在基准上:Psi-R2 以 46.4 分登顶 MolmoSpaces Combined 榜全球第一,超越 PI、DreamZero 等国际顶尖模型;成功率比同类 VLA 高出近 10 倍2
통계 카드를 불러오는 중…
关键不只是推理速度——从 2.2 秒压到 100 毫秒以内——而是样本效率:大规模预训练之后,部署到手机装配、工业包装、叠纸盒等新任务,只需不到 100 条真机轨迹2
闭环由 Psi-W0 世界模型完成:接收图像、语言和动作轨迹,预测未来视频,其中刻意纳入约 30% 失败数据,建模试错与反事实空间1。优质轨迹持续回流训练集,数据飞轮不依赖外部补充就能自转。

智元机器人 GO-2:先「想清楚」,再动手

就在灵初发布的两天前,智元机器人于 4 月 9 日推出 GO-2(Genie Operator-2)3。路线正好相反:不靠数据规模堆泛化能力,靠结构化推理控住执行精度。
核心设计叫动作思维链(Action Chain-of-Thought):模型不直接输出控制信号,先生成高层动作序列规划,描述「要做什么、怎么分步完成」,再通过异步双系统——低频规划与高频跟随紧密协同——稳定落地3。类似工人操作前先在脑子里过一遍流程,而不是直接上手。这套机制的实际价值,在噪声和环境扰动较大的工业场景里体现最明显。
成绩:LIBERO 基准平均成功率 98.5%;Genie Sim 3.0 评测零样本跨域迁移成功率 82.9%3,在现有主流基座模型里是高分段。相关研究成果已被 CVPR 2026 接收——学界认证是这次发布的附加说服力。
통계 카드를 불러오는 중…
规模部署方面,依托 Genie Studio 平台,GO-2 支持千台级机器人协同训练;工业任务分钟级收敛,数据需求比前代降低 50% 以上4

两条路,谁对?

放在一起看,这是两条截然不同的路:灵初押注规模与直接性——人类经验足够丰富,机器人直接继承,绕开繁琐对齐;智元押注结构与推理——先规划再执行,在泛化和零样本迁移上更稳健。
两者并不互斥,最终量产阶段可能殊途同归。但 2026 年同一周同时看到这两个发布,说明核心路线的竞争已经不再停留在学术讨论层面——业界在用真实基准和商业部署数字投票。

Meta 处方 AI 眼镜:4 月 14 日上架,目标人群首次扩到每天戴眼镜的人

4 月 14 日,Ray-Ban Meta Blayzer OpticsScriber Optics 正式在美国光学零售商上架5。这是 Ray-Ban Meta 系列第一次专门为处方眼镜用户做产品设计:可调节镜腿套头、可更换鼻托、定制操作按键,完整适配全天佩戴眼镜的习惯。
起售价 $499(无处方),处方版本加 $200;含小屏的 Display 版同样支持配处方镜片5。AI 功能方面,配合 Meta AI 继续更新:支持语音或拍照方式的营养追踪、Neural Handwriting(EMG 神经接口手写输入)、WhatsApp 消息摘要6
处方款 AI 智能眼镜
图片:AI 生成
扩用户基盘,才是这次的核心逻辑。此前 Ray-Ban Meta 的非处方款,对于日常需要视力矫正的用户意味着「买了也不是每天都能戴」。处方款直接消掉这道摩擦6
Meta AI 眼镜目前在智能眼镜市场占有率约 85.2%6,但竞争密度正在上升——Snap 刚与 Qualcomm 签下多年战略合作,三星、华为、Nothing 均在排队入场。处方款的上市节点选在这个窗口,是在竞争加速前先把可触达人群扩上去。

CEAI 2026:具身智能的「制度基础设施」正在建立

今天是第三届中国具身智能大会(CEAI 2026)在合肥的第二天。
单日两条制度性动作:安徽大学宣布成立机器人学院与脑机接口研究院7;《中国人工智能系列白皮书——具身智能(2026 修订版)》和《2026 具身智能十五大方向》今日举行发布仪式7。宇树科技、智元机器人、越疆机器人等 50+ 头部企业核心技术负责人现场参与,近 200 支队伍参与首届 Dobot 具身智能挑战赛真机决赛8
白皮书和方向图谱的价值,往往不在于「说了什么新东西」,而在于给融资方、政策方、高校提供一套对齐语言的锚点。安徽大学同时建机器人学院和脑机接口研究院,两件事并排,外界将其解读为「操控—感知—意图」完整链路的高校布局起点。

接下来关注

  • 4 月 14 日:Blayzer / Scriber Optics 上架,线下零售初始库存与用户第一批反馈能较快出现
  • 灵初 Psi 系列:开源的 1000 小时数据集上线后,社区实际测试结果是验证数据飞轮理论的真正试金石
  • 智元 GO-2:CVPR 2026 论文公开后,动作思维链的技术细节可做更深入拆解
封面图:AI 生成

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.