
允中 发自 凹非寺量子位 | 公众号 QbitAI后空翻、跑酷、单手抓举几十公斤……过去两年人形机器人最出圈的高光时刻几乎都发生在精心布光的舞台上。但镜头之外有一个更朴素的问题始终悬而未决它到底什么时候能走进你家稳稳端起一杯水、收好一桌碗筷、把脏衣篮抱进洗手间5月20日极佳视界没有再用“五年内”这类含糊措辞来搪塞。它把通用人形机器人真机直接推进了武汉光谷一处真实的居民社区那里有人住、有孩子把玩具撒一地、家具随时会被挪动位置。在发布会现场极佳视界还首次完整披露了过去三年沉淀下来的“双金字塔”技术体系。一边是数据金字塔从互联网视频、真人数据、世界模型模拟器、仿真合成数据一路走到真机数据另一边是算法金字塔围绕世界模拟、动作对齐、经验强化搭建具身基础模型的自我进化路径。资本市场也已经提前投票。2026年3月至4月极佳视界在短短一个月内连续完成两轮融资合计金额约25亿元并跻身国内首个世界模型“百亿独角兽”。于是一个更值得追踪的问题浮出水面当100台机器人开始进入真实家庭当双金字塔体系开始吃到长周期、多变量、带有人类反馈的真机数据当25亿元融资把研发、量产与场景落地同时推上快车道物理AGI会不会真的迎来自己的临界点务实的轮臂机器人与百台真机进家极佳视界联合创始人、首席科学家朱政博士这一次走向台前身上多了一个新标签拾光品牌CEO。作为全场焦点的具身智能C端子品牌朱政在发布会上留下了一段近乎产品宣言的定调AGI不该只停留在屏幕里。我们不是在讲一个遥远的未来故事而是在把骨子里对物理AGI的信仰变成真实的产品。在这款第一代产品——拾光S1的设计哲学里能清晰看到这家公司对“真实家庭场景”极其具体的解构。最具视觉冲击力的“全人形双足”路线并没有出现在拾光S1身上。相反它采用了一种更务实的家庭版轮臂构型——下半身轮式底盘上半身人形双臂。这是一组带有鲜明产品观的取舍。毕竟在现阶段家庭场景对机器人的真实刚需是稳当地端水、收拾餐具、抱起脏衣篮、把零食递到孩子手上而不是在客厅里完成酷炫的跑酷动作。相比之下轮臂构型在稳定性、安全性、续航以及硬性成本上显然都更占优势。面对中国家庭的真实地板宽度、真实门洞尺寸以及真实的预算曲线拾光S1展现出了一种极为清醒且务实的市场姿态。而在务实的硬件外壳之下支撑其运转的是极佳视界自研的具身基础模型GigaBrain系列。该模型实现了从感知、理解到行动的完整闭环能够自主识别物体与场景、规划路径并执行包含抓取、对齐、折叠、归类等多步骤的长程任务。回到硬核的商业化进展上极佳视界现场宣布拾光S1已斩获真实家庭场景的百台量产订单将率先部署于武汉光谷之寓——一处位于光谷的真实居民住宅社区。具体的落地节奏也已经排定好5月31日起拾光S1真实家庭场景展示体验空间面向公众开放第三季度起正式开启百台规模化运营届时下一代产品拾光S2将同步发布并开启真实家庭创始版预定通道。把“100台”这个数字放进全球具身智能的坐标系来看其含金量并不在于数字本身而在于“家庭”二字。纵观全球Figure AI挺进了宝马工厂但其家庭场景仍处于试点阶段1X虽开放过NEO的预订但实际履约规模仍停留在数十台Tesla Optimus至今则尚未真正对外部消费者开售。在主流国内具身智能玩家里目前能够拿出一份可履约家庭订单的团队也屈指可数。究其原因进工厂和进家庭完全是两个数量级的难度。工业工厂是高度结构化的光线、节拍、物料位置基本恒定。而家庭场景则是极度的“非结构化”今天家具被挪动了位置明天孩子把玩具撒了一地后天又有客人突然到访……所有的动态变量都在无限叠加。这也揭示了当前行业最隐秘的痛点——当下具身智能最稀缺的资源不是算法也不是单纯的算力而是在真实家庭里、长周期、多变量、带有人类反馈RLHF的真机数据。这种数据在实验室里造不出来在自动化工厂里也补不出来。一旦第三季度这百台机器人真正跑起来产生的将是难以被复制的核心数据资产家庭场景下的真实故障率、用户偏好分布、更具烟火气的长尾任务清单以及人机交互的真实边界。这些数据将成为GigaBrain后续模型迭代不可替代的燃料。值得注意的是在C端家庭场景高调破局的同时极佳视界的B端工业节奏也在平行推进。就在发布会前不久极佳视界联合一汽模具、阿里云完成了国内首个具身智能机器人在真实工业制造场景的全流程落地。在这场跨界合作中团队成功将传统自动化方案长达数月的场景适配周期压缩到了短短几周。家用求广工业求深。左手C端场景的数据飞轮右手B端工业的标杆落地极佳视界的双线并行矩阵至此已初具雏形。技术方法论解构物理AGI的“双金字塔”体系如果说“百台部署”回答了具身智能产品何时落地的破局点那么“双金字塔”回答的就是另一个更底层、更核心的终极命题物理AGI的Scaling Law究竟该建在什么样的基石之上在发布会现场极佳视界合伙人、研发副总裁叶云首次完整披露了公司过去三年沉淀的技术方法论。△极佳视界合伙人、研发副总裁叶云他直言不讳地指出了当前具身智能行业系统性存在、却鲜少被彻底攻克的两大瓶颈一是数据侧的“既要又要还要”难题。真机数据精度高但成本高、规模小仿真数据可扩展但存在不可忽视的sim-to-real gap虚实迁移鸿沟互联网视频规模极大却缺乏动作监督。任何单一数据源都无法同时满足规模、密度和真实性。二是算法侧的“小马拉大车”困局。主流VLAVision-Language-Action范式习惯性将视觉、动作token化后塞进大语言模型但这套机制天然不擅长处理3D空间信息、物理因果逻辑以及连续动作编码。针对这两大痛点极佳视界给出的解法是将数据与算法分别解构用结构化的“双金字塔”体系强行破局。数据金字塔的核心在于解决模型“喂什么”的问题。极佳视界将其从底到顶划分为5个层级互联网视频数据→真人数据→世界模型模拟器→仿真合成数据→真机数据。在这套架构中底层管广度顶层管精度。而中间三层正是工程化空间最大、也是过去整个行业最被低估的“腰部力量”。分层概念在学术界讨论已两年有余真正拉开差距的是全栈工程化的落地能力。极佳视界直接为每一层都掏出了对应的商业化或自研硬核产品互联网视频层YouTube、Panda-70M等公开海量数据的高效复用真人数据层低成本手持数采硬件“U-01”低成本Ego第一人称视角数采硬件“E-01”仿真合成与世界模型层自研具身世界模型平台“GigaWorld-0”真机数据层家庭版轮臂机器人“拾光S1”低成本真机数采硬件“Maker M01”。从数据采集、数据生成到模型训练全链路100%控在极佳视界自己手里。放眼国内具身智能赛道能对五层数据做如此系统性、全栈式硬核布局的玩家目前或许只有极佳视界一家。一个刚发生的硬核例证是极佳视界与清华大学合作的研究成果R2RGen正式被机器人顶级会议RSS 2026录用。该技术支持机器人在“仅看一条人类演示”的前提下就能完成一组任务的空间泛化其1条演示的训练效果可直接媲美25条真人演示。这正是数据金字塔中用算法工具实现“真机数据高倍率放大”的典型降维打击。如果说数据金字塔是筑基那么算法金字塔解决的就是“怎么学”的自驱路径。它由底到顶分为三层世界模拟→动作对齐→经验强化。在这条路径上极佳视界交出了一份极其罕见的成绩单在全球三大最权威的具身智能评测中同时斩获第一。1、世界模拟层GigaWorld-1在世界模型权威评测WorldArena上一举击败谷歌、英伟达等国际巨头登顶全球第一。它也是全榜单中首个综合得分突破60分大关的具身世界模型。2、动作对齐层GigaBrain-0系列/GigaWorld-Policy极佳视界在该层打出了两张王牌。前者在全球规模最大的真机评测RoboChallenge中力压π0.5等顶流模型斩获第一后者则在面向家庭场景的RoboCasa365中击败了NVIDIA GR00T N1.5成为榜单上首个登顶的世界动作模型World Action Model。3、经验强化层GigaBrain-0.5M*通过“世界模型强化学习”的双向加持真正跑通了具身基座模型的自我进化Self-evolution。将世界生成、真机操作、家庭场景泛化这三种本质不同的能力范式由同一支团队在同一时间节点集中突破这在行业内极具震撼力。至此极佳视界的“双金字塔”完成了它最具里程碑意义的闭环它将物理AGI的Scaling Law路径从纸面上的宏大概念变成了一套可对照、可复现、可被量化评测的系统化落地方案。物理AGI的“GPT-3时刻”何时到来在发布会现场极佳视界还扔出了下一代硬件的重磅预告——拾光S2将于2026年第三季度正式发布。这一次极佳视界没有单纯卷参数而是将准心扣在了“真实家庭可用性”这三个字上。拾光S2三大核心指标的升级路径清晰可见空间瘦身底盘体积直降60%极限贴合中国家庭略显狭窄的过道与玄关续航跃升电池续航暴增70%并全面支持热换电以确保全天候待命纵向延展操作范围扩大40%最高可执行2.2米高度的纵向家务任务。对于这次升级极佳视界联合创始人朱政在现场给出了这样的定义S2的核心不是某个参数变得更漂亮而是整机开始真正接近真实家庭所需要的“可用性”。据悉真实家庭创始版预定通道也将在发布时同步开启。相比于硬件的渐进式改良更具行业风向标意义的是极佳视界首次公开的基础模型12个月路线图。这张“明牌”的时间表直接将具身智能的智能化进程进行了量化GigaBrain-12026年Q3发布据称是全球首个基于“双金字塔”体系打造的物理AGI基础模型GigaBrain-2进一步拉满Scaling Law的加速器GigaBrain-3基于1000万小时视频数据100万小时世界-动作数据训练直接剑指物理AGI的“GPT-3时刻”。在大模型发展史上GPT-3的里程碑意义并不在于模型结构本身而在于它是Scaling Law首次显现“涌现能力”的临界点。当数据规模与算力跨过那个神秘的阈值物理世界的认知就会从量变产生质变。物理AGI的“GPT-3时刻”在理论上同构——当数据规模1000万100万小时与算法范式双金字塔在临界点交汇物理智能体将展现出真正意义上的通用性。这不是指在实验室预设的场景下机械地干十种家务而是意味着它能够“空降”到任何一户真实家庭能应对所有突发的意外并在每一次环境反馈中完成自我进化。过去两年行业对于“物理AGI何时到来”的追问大多得到了“五年内”、“指日可待”等模糊的回应。极佳视界这次直接掀掉底牌把宏大命题拆解为两个确定性的交卷时间需要什么样的体系双金字塔以及什么时候到达临界点12个月。这是一个可以被全行业公开检验的答案。物理AI“梦之队”集结除了技术极佳视界更亮眼的莫过于其核心团队创始人兼CEO黄冠清华大学自动化系创新领军工程博士。曾担任地平线机器人视觉感知技术负责人、鉴智机器人合伙人算法副总裁并拥有微软亚洲研究院、三星中国研究院等顶尖研究机构工作经历。他完整经历了过去十年物理AI的技术和产业发展历程多次带领团队获得全球权威AI比赛世界冠军并发布多个全球知名AI成果。联合创始人兼首席科学家朱政智源青年学者发表顶级论文70余篇引用近2万次。多篇著作影响力巨大连续4年入选全球前2%顶尖科学家榜单多次获得吴文俊自然科学一等奖、最佳学生论文奖、CCF杰出论文奖等荣誉也是多个顶会领域主席、多项竞赛冠军。联合创始人孙韶言曾担任阿里云总监地平线数据闭环产品线总经理在物理世界超大规模数据闭环产品和架构方面拥有行业领先的经验。他主导了业内首个智能驾驶数据闭环系统的落地有效提升了数据的处理效率为智能驾驶技术的发展提供了重要的基础设施支持。合伙人兼工程副总裁毛继明拥有超过16年的仿真/工程/数据/分布式架构方向的经验。曾担任百度Apollo仿真和工程负责人以及曾担任百度、赢彻等T10级别架构师主导多个自动驾驶与世界模型核心项目的技术开发与落地。在高质量数据生成、端到端自动驾驶架构设计以及分布式系统优化领域有着深厚的积累。可以说这支团队完整经历了CV、自动驾驶、具身基模、世界模型等物理AI过去十年的发展历程并在每个阶段都做出了行业领先的世界级成果。当他们聚集在一起就共同造就了这支始终引领具身世界模型技术演进的“梦之队”。资本侧给出的反馈同样明确。在2026年3月至4月短短一个月内极佳视界连续完成两轮融资合计金额高达约25亿元一举跻身国内首个世界模型“百亿独角兽”。据说其背后的投资方矩阵覆盖国内最具代表性的顶尖产业资本华为哈勃就是其中之一、头部财务机构与重磅国资平台。三个悬而未决的问题事实上极佳视界给出了一套将算法数据本体场景商业时间表全栈打通的物理AGI闭环路径。往前看三项全球权威评测冠军证明了算法架构的优越性往下看“百台进社区”印证了工程化的可靠执行力往未来看三代基础模型路线图则给出了明确的航向。站在当前节点未来12个月内至少有三件事值得整个科技界持续追踪第一百台家庭部署能否真正跑出有效数据闭环。家庭环境下机器人能持续工作多久、故障率与人工介入频次、用户偏好如何回流到模型这是物理智能领域目前最稀缺的资产积累。第二2026年Q3的GigaBrain-1是否能如期发布并在能力上对得起“双金字塔”体系所许诺的范式优势。第三GigaBrain-3是否能在12个月后真正触达“GPT-3时刻”——或许这是物理AGI赛道目前最具争议、也最具兑现价值的判断。正如朱政在发布会尾声留下的那句话物理AGI服务每一个人的时代会在一户一户真实家庭中逐渐发生。大幕已经拉开这个预言会不会变成现实我们只需要再等12个月。