给双臂机器人创业公司用的闭环数据 OS,把试点失败转成遥操作队列、评测和更快的模型发布。
双臂机器人创业公司现在还把数据改进当成手工作坊式救火。试点一旦失手,自主团队就得手工翻日志、临时拉遥操作场次,再争论哪些故障值得补新示范,下一轮训练前往往已经白白耗掉几周。开放数据集能帮预训练,但它不会告诉实验室下一步该补哪些现场边角案例,也说不清新一批数据到底有没有把部署缺口补上。
为何现在
- ABC-130K 让机器人团队可以从一条共享遥操作基线起步,最急的问题也就从“先有没有数据”转成“怎么尽快补齐部署专属缺口”。
- 多家来源都开始把数据反馈闭环,而不是模型架构本身,写成具身 AI 继续往前走的卡点。
- XDOF 宣称已有 20 个活跃客户,说明机器人实验室已经愿意为中立型数据基础设施单独列预算,而不再把它只当内部工具。
- 市场现在愿意给数据层平台投钱,不只押注机器人 OEM,这就给了一层位于采集、标注和评测供应商之上的控制平面空间。
催化因素。 XDOF 的 $70 million 亮相、ABC-130K 基准,以及其宣称的 20 客户进展,都说明机器人实验室既有预算,也有紧迫感,开始把数据反馈闭环工业化。
创意
产品夹在机器人运营和模型训练之间。它吃进 ROS bags、视频、操作员备注、SOP 变更和过往评测结果,然后判断哪些故障簇该补更多示范,哪些更适合重标注或调策略。基于这份计划,系统会给内部操作员或认证伙伴拉起遥操作采集队列,持续跟踪溯源和覆盖度,并把每一批数据连同和客户任务指标绑定的回归评测一起打包。时间一长,它就会变成全公司的数据总账:跨任务、跨站点、跨机器人形态,哪些数据真的把真实世界表现拉上去了,一目了然。
差异化。 数据标注公司能给视频打标,但它们不知道哪 500 条示范最能解开某个双臂部署的死结。数据集供应商能卖原始样本,但很少把现场故障、发布决策和任务成功率提升真正闭上环。公司的护城河会来自一张专有映射网:不同故障特征,对应什么采集动作,最终又把下游成功率拉高了多少;项目越多,这张网越厚。
| 滩头市场 | 正处在 Series A–B、手里跑着 1–3 个付费试点单元的双臂机器人创业公司,聚焦电子零部件配套、小零件装配或实验室样本处理,并且要靠每周刷新数据去拿客户扩单里程碑。 |
|---|---|
| 切入点 | 一套故障转数据控制平面:吃进机器人日志和试点视频,聚类故障模式,生成遥操作与标注队列,并在每次模型发布前先把验收评测发出去。 |
| 非显而易见洞察 | 具身 AI 下一个控制点,不是谁手里攥着最大的通用数据集,而是谁能把现场故障转成下一批产出最高的示范,并证明这些数据真的把任务指标往上推。开放遥操作语料把预训练基线抬高以后,每家实验室真正稀缺的资源不再是原始存储,而是优先级判断和闭环学习。 |
| 风险投资级路径 | 先从双臂操作试点切入,再扩成仓储、人形、实验室和野外机器人通用的数据发布系统:管优先级、溯源、供应商编排、基准测试,以及任何具身 AI 团队都要的发布闸口。 |
| 主要用户 | 一家 40–150 人的机器人创业公司里,负责自主系统或数据引擎的负责人;公司正在为电子零部件配套、小零件装配或实验室样本处理试点训练双臂操作系统。 |
|---|---|
| 次要用户 | 在支持多个客户环境并按周发版的机器人实验室里,负责遥操作运营或 ML 平台的经理。 |
| 经济买方 | Autonomy VP、CTO 或 ML 平台负责人 |
| 首个客户 | 一家美国双臂机器人创业公司,手里有一个付费的电子装配或实验室自动化试点;在季度扩单复盘前,它必须把 2–3 个失手任务步骤的成功率拉回来。 |
|---|---|
| 购买触发点 | 试点客户要求新增 SKU、治具或工作流变体,而自主团队在下一次评审前没有把握完成重训。 |
| 当前替代方案 | 人工审日志、Excel 分诊、内部遥操作场次,以及一次性的标注外包。 |
| 切换理由 | 这套平台把“现场失手”到“验证过的重训批次”之间的链路压缩下来,让团队把稀缺的遥操作时数花在产出最高的缺口上,也能带着证据发模型更新。 |
| 定价假设 | 按活跃机器人项目或试点单元收年费平台许可,外加外部采集与评测的用量收费。 |
待完成任务
| 任务 | 当前替代方案 | 成功指标 |
|---|---|---|
| 当试点单元在新零件变体上开始失手时,帮自主团队决定下一步该采哪些示范,这样他们才能在客户复盘前把任务成功率拉回来。 | 人工审日志,加临时遥操作和标注请求 | 从识别出故障簇到批准重训批次的天数 |
| 当管理层追问这轮数据冲刺到底有没有用时,帮数据引擎负责人把每一批数据和回归评测变化对上号,这样他们就能带着证据决定发版还是暂缓。 | 离线分析脚本、Excel,以及拍脑袋的发版会 | 有通过任务级验收评测背书的发布占比 |
flowchart LR Buyer[Dual-arm robotics startup] --> Pain[Pilot failures and slow demo prioritization] Pain --> Product[Failure-to-data control plane] Product --> Outcome[Faster retraining and higher task success]
- 信号 · 5/5这组信号同时包含大额 stealth launch、点名的开放数据集基准和客户进展,足以说明品类在变。
- 痛点 · 4/5对已经拿到付费试点的团队来说,这个痛点很重——数据闭环慢一点,就可能错过扩单;但对纯研究团队,紧迫度没那么高。
- 切入点 · 5/5围绕双臂试点做“故障到数据”的优先级管理,是一条又窄又急的工作流,和通用标注或数据集售卖区分得很开。
- 防御性 · 4/5护城河会从故障簇、采集动作和任务增益之间的专有映射里长出来,即便更大的数据供应商也可能往上游爬。
- 规模化 · 5/5滩头市场之后,公司可以扩成多类具身 AI 项目的发布和数据总账。
- 遥操作服务提供商
- 标注与评测供应商
- 提供结果数据的机器人实验室
- 电子装配和实验室自动化系统集成商
- 摄取机器人故障和操作员上下文
- 生成遥操作与标注队列
- 为模型发布跑验收评测
- 故障聚类与优先级引擎
- 机器人数据的溯源与覆盖图谱
- 把数据批次和结果增益连起来的基准库
- 把试点失败转成有优先级的数据计划
- 缩短从现场失手到验证重训之间的时间
- 证明哪些示范真的抬高任务成功率
- 围绕一个试点单元做高触达导入
- 与自主团队保持每周数据复盘节奏
- 给新任务和新站点准备扩张手册
- 面向自主负责人做创始人主导销售
- 与操作机器人创业公司做共创合作
- 来自机器人投资人和集成商的转介绍
- 双臂机器人创业公司
- 将操作模型商业化的机器人实验室
- 跑重复部署的系统集成商
- 机器人 ML 和数据工程人才
- 对接机器人日志栈
- 试点项目的客户成功
- 伙伴 QA 和评测算力
- 年度平台订阅
- 按活跃机器人项目或试点单元收费
- 外部采集与评测的用量费
市场
| TAM | $0.4B 估算:全球约 1,200 个更广义的具身 AI 或机器人学习项目 × 每年约 $350k 的数据控制、采集编排和发布评测混合支出;锚点来自自动化需求回暖、AI 基础设施融资仍强,以及中立型数据平台已经能拿下企业客户。 |
|---|---|
| SAM | $22.5M 估算:电子、小零件和实验室工作流里约 90 个滩头双臂试点项目 × 每个活跃项目每年约 $250k;约束条件是只看 Series A–B、已有付费试点、而且存在周度重训紧迫度的团队。 |
| SOM | $3.6M 估算:第 3 年触达 15 个项目 × 约 $240k 的混合 ACV;前提是用共创客户驱动的打法打进一个虽小但活跃、而且已经会为相邻数据与 RobOps 工具付费的买方群体。 |
高管要点
- 最可信的证据都指向同一件事:具身 AI 的控制点正在从“谁拥有一份巨型通用数据集”转到“下一步该采什么故障、怎么证明有增益、以及跨版本如何把溯源链守住”[7][9][10][14][15][16][29][31]。
- 相邻在位者都是真的,但都没补全:XDOF 最接近采集基础设施,Foxglove 吃住多模态日志,InOrbit 和 Formant 吃住 RobOps,Scale 卖的是标注产能;可公开信息里,还看不到谁真正占住了这里提出的“面向操作任务、从故障到发布的控制平面”[1][2][17][18][19][20][21][22][23]。
- 滩头市场不大,但很急:任务变体一变,付费试点团队还是要立刻补新示范;而一旦扩单里程碑绑在结果上,买方已经愿意为中立型数据或运维工具掏钱[2][5][12][13][17][19][21]。
- 合规和集成都不是枝节问题:ROS2 / rosbag2、RLDS、MCAP 和 LeRobot 正在收敛成技术底座;同时 OSHA、EU AI Act 和 NIST 都在奖励审计就绪的日志能力和部署后监控[24][25][26][27][28][29][30][31]。
市场定义
这个品类夹在机器人运营和模型训练之间:它把双臂操作项目里的部署故障,转成带优先级的采集队列、带溯源标签的数据批次,以及跨 ROS 2、MCAP、RLDS 和现代 VLA 训练栈的发布把关评测[9][10][17][18][28][29][30][31][35][36]。
用户与买方
最好的早期客户,是那些跑着 1–3 个付费操作试点的 Series A–B 团队:新 SKU、治具或工作流变体一出现,扩单收入就可能受影响;真正拍板的经济买方,仍然是同时盯发布节奏和试点结果的 Autonomy VP、CTO 或 ML 平台负责人[2][5][12][13][20][21][24]。
购买触发点
- 新零件变体或站点特例一出现,现有策略开始失手,团队就必须在下一次客户复盘前判断:最快的修法是补新示范、重标注,还是调策略。 [12][13][40]
- 自主团队在 ROS bags、视频复盘、遥操作供应商和临时 评测脚本 之间的手工交接越堆越多,已经没法有把握地按周发模型更新。 [18][28][29][30][31][34]
- 买方或安全评审要求更清楚地追溯:两次发布之间到底改了什么,新行为又是怎么在现场被量出来的。 [24][25][26][27][32][33]
支付意愿
这个生态里,中立基础设施预算已经被接受:XDOF 在隐身期就卖数据基础设施,Foxglove 打包成完整的 具身 AI 数据平台,InOrbit 和 Formant 在卖联系销售的运营软件,Scale 仍然是高价下游服务。这个格局说明,只要软件能直接绑到试点成功、正常运行时间或发布信心,付费意愿就存在;但产品卖点必须是“少耽误事”,不是泛泛的存储[2][17][19][20][21][22][23]。 [2][17][19][20][21][22][23]
品类动态
顺风因素
- 开放数据集和 VLA 发布把基线抬高了,也让策展、溯源和评测编排更值钱。
- 融资市场仍愿意支持 AI 和具身 AI 的基础设施层下注。
- ROS2、RLDS、MCAP 和 LeRobot 正在朝更可复用的数据管线收敛。
逆风因素
- 买方群体集中、技术门槛高且集成重,这会把销售和 接入 成本一起抬高。
- 如果没有可测的发布效果,仅靠存储或仪表盘很难收费,因为开源模型和相邻工具替代太多。
验证信号
- 中立型机器人数据基础设施这个品类,市场上已经存在,不只是研究概念——XDOF 的定位和发布材料就是明证。
- 领先的 具身 AI 团队公开承认:数据稀缺和数据质量,仍然是部署进展的限制因素。
- 双臂生态今天依旧更依赖遥操作密集型工作流和基准 / 工具项目,而不是成熟的商业化发布系统。
- 开源数据格式和评测栈已经标准化到足够程度,厂商中立的编排层可以直接插进去,而不用从零发明整套栈。
监管与技术约束
- 任何直面部署的工作流都必须保留安全和危险上下文,因为 OSHA 的机器人指导依旧要求严谨的事件识别和锁定挂牌流程,而不是给机器人单开豁免。
- 面向欧洲的买方会更在意日志、人工监督和部署后监控,因为这些正是可访问版 AI Act 里写得最明确的主题。
- 越来越多企业买方会要求用 NIST 那一套治理语言来谈度量、管理和监控,尤其是当 AI 系统直接影响物理结果时。
- 技术集成本身并不简单,因为相关产物横跨 rosbag2 日志、RLDS 轨迹片段、MCAP 容器和 LeRobot 式 Parquet / 视频 打包。
竞争
XDOF 是最接近的上游专门选手,因为它已经公开举起“机器人数据基础设施”这面旗[1][2]。Foxglove 是最强的横向底座,开发者信任它的日志、MCAP 和多模态回放能力,但本质上它仍以被动存储和可视化为主[17][18][30]。InOrbit 和 Formant 证明 RobOps 买方愿意为控制界面买单,但它们优化的是车队或告警运营,不是操作数据策展[19][20][21][22]。当团队已经知道该标什么时,Scale 仍然是最清晰的下游替代品;可它并不回答“到底该先管哪类故障”[23]。
| 竞争对手 | 阶段 | 切入点 | 定价 | 优势 | 相对劣势 |
|---|---|---|---|---|---|
| XDOF | 成长期 | 面向 具身 AI 团队的生产级机器人数据采集、遥操作和工具基础设施。 | 未公开 | 在中立型机器人数据基础设施和双臂遥操作可信度上最接近本案。 | 它看起来最强的是上游采集和数据集供给,而不是持续的现场故障优先级和发布治理。 |
| Foxglove | 成长期 | 面向机器人数据的多模态引擎:记录、整理、可视化日志,以及 MCAP 生态。 | 免费层 + 企业版 / 联系销售 | 开发者采用强、开源护城河深,而且在多模态回放上已拿到企业信任。 | 它本质上仍偏被动、偏分析驱动,公开产品里看不到它直接掌控故障聚类、队列生成或验收评测把关。 |
| InOrbit | 成长期 | 覆盖开发者到企业车队的云端 RobOps 指挥中心。 | 免费开发者入口 + 企业版 / 联系销售 | 多供应商机器人运营栈已经很成熟,包装清楚、工作流深。 | 它优化的是车队和任务运营,而不是操作 轨迹片段 策展和数据发布决策。 |
| Formant | 成长期 | 面向物理系统的工业运营与事件管理 AI。 | 联系销售 / 结果导向定价 | 相邻赛道里闭环运营命题讲得最好,工业集成叙事也很强。 | 它闭的是告警和现场事件,不是双臂自主团队的数据—策略闭环。 |
| Scale AI | 在位企业 | 面向 具身 AI 的企业级标注、数据引擎和采集服务。 | 企业版 / 联系销售 | 标注规模、安全姿态和采购可信度都很强。 | 它更像下游执行供应商,不是决定下一步该采什么、也不是决定这次发布能不能发的系统。 |
为什么现有厂商不会默认胜出
- 云平台与模型平台. OpenVLA、GR00T 和 openpi 让前沿模型访问不再那么稀缺,但它们不会决定下一步该采哪些站点专属故障,也不会证明一批新数据真的把任务 KPI 推上去了。
- 机器人运营平台. InOrbit 和 Formant 吃住的是监控、事件和操作员工作流;它们公开的产品语言仍围绕指挥中心和告警处置,而不是操作 轨迹片段、示范规划和发布把关。
- 可视化与数据湖工具. Foxglove 和 MCAP 是记录、搜索和回放多模态日志的强力底座,但如果没有另一层自动发现故障并路由任务,它们本质上还是拉取式工具。
- 标注供应商. Scale 能提供标注劳动力和合规能力,但它处在真正决策问题的下游:该采哪些故障、要买多少示范,以及这次发布到底能不能安全发出去。
- 内部数据工具. 开源遥操作和基准栈让团队可以自己搭,但 DROID、UMI、COBALT 和 ALOHA 都说明,数据采集和策展很快就会变成极重的运营活。
商业计划
Bimanual Feedback Loop OS 最该先做的,是面向美国 Series A–B 双臂机器人创业公司的“故障转数据”控制平面;这些公司在电子装配、小零件作业或实验室样本处理场景里,通常跑着 1–3 个付费试点单元。第一位客户会是自主系统或 ML 平台负责人:新 SKU、治具或工作流变体一出来,季度扩单评审前有几步任务突然失手,他得尽快把成功率拉回来。首版产品要能吃进 ROS2 日志、视频、操作员备注和历史评测,先把故障聚类,再生成遥操作或重标注队列,并在发版前把每一批数据挂到验收评测上。这个切口吸引人的地方在于,开放遥操作数据集正在把预训练基线抬高,真正卡住团队的反而变成:下一批到底该采哪几百条示范,才真能把现场部署指标拉动起来。XDOF、Foxglove、InOrbit、Formant 和 Scale 说明相邻预算已经存在,但现有研究里还看不到谁把“面向操作任务的故障优先级 + 发布治理”真正做成一个产品。市场证据支持一个聚焦的滩头市场:SAM 约 $22.5M,模型测得第 3 年可触达 SOM 约 $3.6M,所以投资逻辑能不能成立,最终还是看它能否从双臂试点一路扩到更广的具身 AI 数据发布工作流。最大风险有三类:机器人栈太乱导致集成拖慢、很难因果证明一次数据冲刺真的带来了性能增益,以及数据或 RobOps 平台把功能打包吃掉。公开材料仍然没有回答两个关键问题:到底有多少目标团队真的在周度或月度 SLA 压力下重训;以及买方会不会宁愿接受打包方案,而不是再上一层厂商中立的控制平面。所以前 12 个月既是建产品,更是证伪期。
问题
- 试点一旦失手,自主团队还是得手工翻 rosbag 和视频,争论哪些故障最该处理,再临时发出遥操作或标注请求,重训周期很容易被拖成几周。
- 开放数据集能帮预训练,但真正到了现场部署,它不会告诉团队下一步该采哪些站点专属故障,也不会告诉你补新示范、重标注还是调策略,哪条路修得最快。
- 买方手里也缺一份干净的发布记录,没法把每一批数据和验收评测的变化对上号,扩单复盘和安全审查自然都会慢下来。
解决方案
- 把 rosbag2、视频、操作员备注和过往评测归到同一条故障时间线里,聚类反复出现的失手,再按预期任务增益给干预类型排优先级。
- 给内部团队或认证伙伴生成遥操作、标注或策略复盘队列,并把采集、标注和评测全链路的溯源串起来。
- 每次覆盖到的模型发布,都用和客户任务指标绑定的前后验收评测来把关,让产品成为“哪些数据真的改了现场表现”的总账。
为什么我们会赢
- 公司解决的是“下一步该采什么、现在能不能发版”这种操作任务特有的决策题,不是泛日志、车队运营或纯标注执行。
- 厂商中立的一层可以架在 XDOF 式采集、Foxglove 或 MCAP 日志,以及下游标注供应商之上;对已经混用多套工具的买方,这一点很值钱。
- 时间一长,护城河会沉淀成一张跨项目图谱:从故障特征到干预类型,再到可测增益;再加上内部团队往往维护不稳的审计级溯源。
| 滩头市场 | 美国 Series A–B 双臂机器人创业公司,在电子装配、小零件处理或实验室样本流程里跑着 1–3 个付费试点单元;只要一个任务族失手,就可能卡住扩单收入。 |
|---|---|
| 切入点理由 | 这个入口比泛机器人数据平台更容易更快做出验证,因为痛点直接绑在客户里程碑上,相关日志和任务指标又集中在一个试点单元里;买方群体也够小,适合创始人亲自访谈、快速迭代产品。 |
| 推进顺序 | 公司应先把一套可复用的 ROS2 + 视频栈打磨出来:摄取、故障排序、生成队列、输出验收评测。等首批试点转正,再补解决方案和运营岗位。合作伙伴早期更该被当作遥操作和评测产能的延长线,而不是销售渠道——眼下比线索量更重要的,是把到价值时间和增益归因跑实。 |
| 暂不进入 | 通用型机器人可观测性或数据湖平台 · 自建供给的托管式遥操作劳务市场 · 在双臂打法还没复用前就去做仓储车队或人形机器人工作流 · 在美国的审计与部署叙事还没产品化前就先做欧洲销售 |
| 切入点 | 围绕一个现场试点单元里的单一失手任务族,卖一轮付费共创客户冲刺;承诺在下一次客户评审前,把“现场失手→批准重训批次”的路径压短,也让团队更清楚该发版还是该暂缓。 |
|---|---|
| 渠道 | 对目标机器人创业公司的自主负责人、ML 平台负责人和 CTO 做创始人主导直销 · 借机器人投资人、实验室社群和已在操作项目里的系统集成商做转介绍 · 从 ROS 2、Foxglove、MCAP 和 LeRobot 工作流切入开发者侧采用,因为这些地方的回放、溯源和交接痛点已经摆在台面上 |
| 漏斗目标 | 目标账户引荐→合格共创客户 25–35%,付费试点→年度生产合同 50%+,首个项目→第二个项目扩单在 12 个月内达到 50%+。 |
| 定价 | 先做 12 周的付费共创客户,价格约 $40k-$60k,并可抵扣每个活跃试点单元 $180k-$250k 的年度平台许可;另外再收外部采集与评测的用量费。这既对齐研究里约 $240k-$350k 的年花费区间,也把定价锚在影响发布的关键项目上,而不是席位或存储。 |
| MVP | MVP 先服务一个试点单元,支持 rosbag2、视频和操作员备注摄取,外加故障聚类、队列生成、溯源打标和验收评测报告。数据导出要兼容 MCAP、RLDS 和 LeRobot;同时明确不在 v1 就把自己做成通用模型训练栈或遥操作劳务市场。 |
|---|---|
| 6 个月 | 启动 2–3 个共创客户试点,把第一版排序后的故障队列压到 10 个工作日内交付,并围绕电子装配与实验室自动化这个初始切口,上线按周故障复盘、伙伴队列路由和基础发布签核。 |
| 12 个月 | 补齐可复用的 Foxglove 和 MCAP 集成、批次级增益归因、基于角色的审批,以及多站点发布历史,让同一客户能在一套控制平面里管多个试点单元。 |
| 24 个月 | 扩成相邻操作项目的发布治理总账:跨客户基准、审计导出,以及更深的评测与训练栈集成。 |
| 关键押注 | 现场部署里的故障会以足够清晰的模式反复出现,因而聚类和分诊能明显胜过人工复盘。 · 买方会把验收评测把关和溯源当成控制面,而不只是分析仪表盘。 · 围绕 ROS2、视频、MCAP 和 RLDS 的一套集成模板,足以覆盖大部分早期客户,而不用做咨询型重交付。 · 这套工作流能在在位者打包吃掉之前,从双臂试点扩到其他操作品类。 |
| 收入来源 | 按活跃试点单元或机器人项目收年度平台订阅 · 对外部采集、标注和评测编排收用量费 · 对跨站点溯源、审计导出和组合级发布治理模块收高级版费用 |
|---|---|
| 价值单位 | 处在发布治理之下的活跃机器人项目或试点单元 |
| 目标毛利率 | 70% |
| 扩张杠杆 | 在同一客户内部继续加试点单元、任务族和站点 · 从双臂试点扩到同样受发布与溯源痛点困扰的相邻操作品类 · 通过审计、伙伴 QA 和跨项目基准模块提高钱包份额 |
| 北极星指标 | 从现场故障簇出现到批准重训批次并通过验收评测的中位天数 |
|---|---|
| 输入指标 | 从原始日志摄取到第一版排序故障队列的时间 · 每个被接受的高优先级批次耗掉多少遥操作工时 · 被覆盖发布里,带有前后验收评测的占比 · 付费试点转年度生产合同的转化率 · 每个客户的活跃项目数 |
| 待构建护城河 | 跨项目的图谱:从故障特征到干预类型,再到可测任务增益 · 横跨 rosbag2、MCAP、RLDS 和 LeRobot 式产物的厂商中立溯源图谱 · 按任务族、站点条件和操作员质量切分的发布结果基准库 · 把外部采集质量和下游成功率连起来的伙伴网络 QA 数据 |
| 终止标准 | 做完 25 次合格滩头客户对话后,付费共创客户仍少于 3 个 · 前 3 个试点没能把“从识别故障到批准批次”的时间至少压缩 50% · 前 5 个试点里,付费试点转年度生产合同的比例始终低于 40% · 做过现场评估后,超过 70% 的合格机会还是选择打包的 XDOF、Foxglove、RobOps 或内部工作流 |
里程碑
- 在双臂电子装配和实验室自动化滩头市场里,签下 3–5 个付费共创客户。
- 把已覆盖项目里“识别故障→批准重训批次”的时间至少压缩 50%。
- 至少把 2 个试点转成年度生产合同。
- 把“接入→第一版排序队列”产品化到 10 个工作日内。
- 做到 5–7 个客户、8–10 个生产项目。
- 补齐多站点发布历史、基于角色的签核和审计导出。
- 在现有账户里,从第一任务族扩到第二条工作流。
- 建立 2 个伙伴关系:要么能带来机会,要么能按要求质量执行采集与评测。
- 做到约 15 个生产项目,或达到与模型里 $3.6M SOM 一致的 ARR。
- 把控制平面扩到至少一个双臂之外的相邻操作品类。
- 根据留存、赢单率和集成复用性,决定是否扩到仓储或人形机器人项目。
flowchart LR Wedge[Dual-arm pilot wedge] --> MVP[Failure-to-data control plane MVP] MVP --> Proof[Shorter retraining loops with auditable lift] Proof --> Expansion[Release system of record across manipulation programs]
创始团队
| 角色 | 入职时间 | 理由 |
|---|---|---|
| 创始人 / CEO | 第 0 个月 | 在打法还没跑顺之前,先亲自抓 ICP 发现、创始人主导销售、共创客户招募和伙伴生态。 |
| 创始工程师 | 第 0 个月 | 搭好摄取、溯源图谱和第一版故障复盘工作流,把首批试点验证所需的底座先跑通。 |
| ML / 数据基础设施负责人 | 第 1 个月 | 负责故障聚类、队列排序和验收评测度量,让产品能证明因果增益。 |
| 解决方案工程师 | 第 3 个月 | 把 ROS2 和视频 接入 产品化,把到价值时间压在两周以内,并削掉服务拖累。 |
| 产品与运营负责人 | 第 6 个月 | 在真实试点里把发布工作流、伙伴 QA 和审计导出要求跑顺。 |
| GTM 负责人 | 第 12 个月 | 只有当付费试点信息、实施和定价都显出可复用转化后,才加销售 pipeline 产能。 |
实验路线图
| 阶段 | 实验 | 假设 | 成功指标 | 负责人 |
|---|---|---|---|---|
| 0–90 天 | ICP 与购买触发访谈 | 目标创业公司里的自主负责人会把新 SKU 或治具变体,加上扩单复盘,描述成最直接的预算触发器。 | 完成 15 次访谈,其中至少 8 次匹配这一触发器,并识别出 5 个活跃机会。 | 创始人 / CEO |
| 0–90 天 | 人工陪跑式历史日志分诊 | 在历史 rosbag2 和视频数据上做故障聚类,能够在不漏关键故障模式的前提下,把推荐示范集压得比人工复盘更小。 | 2 个共创客户各自拿 50 条以上历史轨迹片段做基准,并接受至少 70% 的优先级队列。 | 创始工程师 |
| 90–180 天 | 真实试点单元数据冲刺 | 产品能在真实试点单元里,把“识别故障→批准重训批次”的时间至少压缩 50%。 | 3 个试点各完成 1 次冲刺,且到批准批次的时间都低于 21 天,并留下明确的发布决策记录。 | ML / 数据基础设施负责人 |
| 90–180 天 | 定价与合同包装测试 | 对自主买方来说,按项目定价会比按席位或存储定价更容易成交。 | 选中的方案在 8 次定价沟通里赢下 5 次,并进入 2 份已签试点 范围。 | 创始人 / CEO |
| 6–12 个月 | 集成模板可复用性测试 | 一套 ROS2、视频、MCAP 和 RLDS 的 接入 模板,能让大多数客户在 10 个工作日内跑到可用的摄取和发布报告。 | 前 5 个生产部署里有 4 个达标,而且不需要新增连接器。 | 解决方案工程师 |
| 12–18 个月 | 伙伴供给的采集与评测交付 | 合格的遥操作和评测伙伴能扩张交付产能,同时不牺牲数据质量,也不拖慢转化。 | 25% 的高优先级队列量通过认证伙伴执行,且验收评测结果不差于内部采集。 | 产品与运营负责人 |
风险评估
- R1定制化机器人栈的集成复杂度拖慢 接入 和到价值时间。 — 先押一套以 ROS2、视频和 MCAP 为中心的模板;在前 5 次部署跑出复用性之前,ICP 之外的定制栈一律不接。
- R2XDOF、Foxglove 或 RobOps 供应商把足够多的工作流打包进去,差异化被压缩。 — 靠厂商中立的故障优先级、增益归因和发布治理赢,而这些恰好是打包工具最难证明的。
- R3因为模型调参或 SOP 变更搅在一起,数据增益归因始终说不清。 — 试点合同只围绕一个固定任务族、一套预定义验收指标和锁定的对照窗口来签。
- R4滩头市场太小或过于间歇,没法在扩到相邻场景前支撑高效直销。 — 把前 12 个月当成证伪阶段;只有相邻操作项目在发布节奏和溯源痛点上真的同构时,才往外扩。
- R5客户视频和现场日志的安全审查拖慢成交,或者限制了可用数据访问。 — 从第一批试点 范围 开始就给出“不拿去训练”的承诺、可导出的 溯源链,以及清晰的数据处理控制。
| 风险 | 可能性 | 影响 | 缓解措施 |
|---|---|---|---|
| 定制化机器人栈的集成复杂度拖慢 接入 和到价值时间。 | High | High | 先押一套以 ROS2、视频和 MCAP 为中心的模板;在前 5 次部署跑出复用性之前,ICP 之外的定制栈一律不接。 |
| XDOF、Foxglove 或 RobOps 供应商把足够多的工作流打包进去,差异化被压缩。 | Medium | High | 靠厂商中立的故障优先级、增益归因和发布治理赢,而这些恰好是打包工具最难证明的。 |
| 因为模型调参或 SOP 变更搅在一起,数据增益归因始终说不清。 | Medium | High | 试点合同只围绕一个固定任务族、一套预定义验收指标和锁定的对照窗口来签。 |
| 滩头市场太小或过于间歇,没法在扩到相邻场景前支撑高效直销。 | Medium | High | 把前 12 个月当成证伪阶段;只有相邻操作项目在发布节奏和溯源痛点上真的同构时,才往外扩。 |
| 客户视频和现场日志的安全审查拖慢成交,或者限制了可用数据访问。 | Medium | Medium | 从第一批试点 范围 开始就给出“不拿去训练”的承诺、可导出的 溯源链,以及清晰的数据处理控制。 |
| 标题 | 双臂机器人创业公司的自主系统负责人 |
|---|---|
| 画像 | 一家 40–150 人的美国机器人公司,在电子装配或实验室自动化场景里跑着一个付费试点单元,并围绕扩单里程碑高频发布模型更新。 |
| 触发点 | 新 SKU、治具或工作流例外一出现,季度客户复盘前就有 2–3 个任务步骤开始失手。 |
| 买方 | Autonomy VP、CTO 或 ML 平台负责人 |
| 初始合同 | 先围绕一个试点单元签 $40k-$60k、12 周的共创客户合同,再转成约 $180k-$250k 的年度平台许可,并叠加采集与评测用量费。 |
必须成立的条件
- 前 15 个合格目标账户里,至少有 8 个要承认:只要试点工作流一变,他们每月至少都会遇到一次发布或重训压力。
- 付费试点里至少有一半,必须愿意在大规模车队部署之前就接受一条独立软件预算线,而且年化金额高于 $180k。
- 前 5 次部署里,至少 4 次要能在 10 个工作日内把 ROS2 和视频摄取、外加队列生成跑到可用。
- 前 3 个真实试点里,推荐的数据冲刺要么把指定验收指标拉上去,要么把“到批准批次”的时间至少压缩 50%。
- 面对打包方案或内部替代,创业公司至少要赢下一半已评估机会,并靠更强的故障优先级和发布可追溯性取胜。
待尽调问题
- 到底有多少滩头团队是真的在客户 SLA 压力下重训,而不是按季度研究节奏推进?
- 第一笔预算到底从哪条线出:自主软件、试点运营,还是外部数据采集?
- XDOF、Foxglove、InOrbit 或 Formant 现在多频繁地已经卡进目标工作流?它们的产品缺口,哪些是长期的,哪些只是暂时的?
- 验收评测能不能把数据增益和单独的模型调参或 SOP 变更干净地拆开?
- 如果买方已经在用某家偏爱的采集或日志供应商,他们到底还想要多强的厂商中立性?
| 结论 | 值得见面 / 继续尽调 |
|---|---|
| 信心 | 这是新控制点上的一个有前景切口,但前提是要先证明:在一个非常小的早期市场里,重训的紧迫度和独立预算都足够普遍。 |
| 相信的理由 | 计划瞄准的是一条和收入直接相关的部署瓶颈:买方明确,相邻预算已经存在,而且它卡在采集、可观测性和发布治理之间,能站出一条差异化的厂商中立路径。 |
| 怀疑的理由 | 短期买方群体很集中,集成也重;如果客户愿意接受打包工作流而不是再上一层控制平面,相邻玩家很快就可能把窗口期压没。 |
| 下一步尽调 | 先确认 3 个付费共创客户:产品能否把“到批准批次的天数”压下来,并至少把其中 2 个转成 ACV 高于 $180k 的年度合同。 |
财务模型
| 第 1 年收入 | $420K EBITDA $-885K · 期末现金 $1.72M |
|---|---|
| 第 2 年收入 | $1.70M EBITDA $-947K · 期末现金 $768K |
| 第 3 年收入 | $3.23M EBITDA $-384K · 期末现金 $384K |
| 年 ARPU | $245K |
|---|---|
| 毛利率 | 73% |
| CAC | $96K 回本期 6.4 个月 |
| LTV / CAC | 7.8x 生命周期价值 $745K |
| 轮次 | 种子前轮 · $2.6M |
|---|---|
| 跑道 | 24 个月 |
| 里程碑 | 做到 5-7 个客户、8-10 个生产项目,把 接入 到第一版排序队列压到 10 个工作日以内,并在 seed 融资前至少证明一次第二项目扩单。 |
模型合理性
- 收入引擎. 基础收入来自付费活跃项目数的增长:从 Y1 末的 4 个,到 Q4Y2 的 10 个、Q4Y3 的 15 个;同时单项目混合实现收入从约 $180K 升到约 $245K。
- 必须跑通的环节. ROS2 / 视频 接入 模板和验收评测工作流,必须足够可复用,才能把首个队列压进 10 个工作日,并在没有重服务团队的前提下做到 70% 出头的毛利率。
- 模型失效条件. 如果销售周期拉长,Y3 只做到 12–13 个活跃项目,那么在下一轮融资证明点站稳前,下行情景就会把现金低点打成负数。
- 下一轮融资证明点. 当公司做到 5–7 个客户、8–10 个生产项目,至少有一次第二项目扩单,并把季度 烧钱 在 Q4Y2 到 Q2Y3 期间压到约 $60K 区间时,seed 融资故事最强。
- 营收(线/面积)
- 期末现金(虚线)
- EBITDA(柱,灰色为亏损)
- 创始人 / CEO
- 平台工程
- ML / 数据基础设施
- 解决方案工程
- 产品 / 运营
- GTM
- G&A / 财务
| 第3年营收 | 第3年 EBITDA | 现金最低点 | 说明 | |
|---|---|---|---|---|
| 下行 | 机器人集成的可复用性更差,量产爬坡更晚,项目定价也更靠近区间下沿。 | |||
| 基准 | 创始人主导的共创客户按计划转化,一套 ROS2 + 视频集成模板开始可复用,用量费在第 3 年小幅挂上。 | |||
| 上行 | 第二项目扩单来得更早,共创客户口碑缩短了销售周期,毛利率也比计划爬得更快。 |
| 变量 | 下行 | 上行 | 现金影响 | 营收影响 |
|---|---|---|---|---|
| CAC | 创始人主导销售始终很手工,CAC 会飘向每个活跃项目约 $125K。 | 客户推荐和投资人转介绍把 CAC 拉近到约 $75K。 | ||
| ARPU | 用量费和第二项目扩单挂得更晚,Y3 的实现 ARPU 只会落在约 $220K-$230K。 | 审计治理和伙伴路由用量把 Y3 的实现 ARPU 推向约 $255K-$260K。 | ||
| 招聘节奏 | 在 接入 模板还没证明前,3 个扩张岗位就提前了两个季度。 | 最后 2 个岗位可以等到 Q3Y3 之后再补,而且不伤交付。 | ||
| 销售周期 | 从试点到生产的周期会从约 90 天拉长到 150 天。 | 参考客户和标准集成包会把周期压到约 60 天。 | ||
| 毛利率 | 如果伙伴管理的数据工作仍占较大比重,毛利率会卡在 70% 左右。 | 如果摄取模板和 QA 工作流更快标准化,毛利率会走到 75% 左右。 | ||
| 流失率 | 如果有少数机器人团队标准化到打包替代方案,月流失率会逼近 3.0%。 | 如果控制平面嵌进发布签核,月流失率会贴近 1.2%。 |
情景
| 情景 | 第 3 年收入 | 第 3 年 EBITDA | 现金低点 | 说明 | 关键变化 |
|---|---|---|---|---|---|
| 下行 | $2.76M | $-752K | $-190K | 机器人集成的可复用性更差,量产爬坡更晚,项目定价也更靠近区间下沿。 |
|
| 基准 | $3.23M | $-384K | $384K | 创始人主导的共创客户按计划转化,一套 ROS2 + 视频集成模板开始可复用,用量费在第 3 年小幅挂上。 |
|
| 上行 | $3.76M | $114K | $1.02M | 第二项目扩单来得更早,共创客户口碑缩短了销售周期,毛利率也比计划爬得更快。 |
|
敏感性
| 变量 | 下行情景 | 基准情景 | 上行情景 |
|---|---|---|---|
| ARPU | 用量费和第二项目扩单挂得更晚,Y3 的实现 ARPU 只会落在约 $220K-$230K。 | Y3 的混合实现 ARPU 达到每个活跃项目约 $245K。 | 审计治理和伙伴路由用量把 Y3 的实现 ARPU 推向约 $255K-$260K。 |
| CAC | 创始人主导销售始终很手工,CAC 会飘向每个活跃项目约 $125K。 | CAC 大致守在 Y2 这套动作的 $95.6K 附近。 | 客户推荐和投资人转介绍把 CAC 拉近到约 $75K。 |
| 流失率 | 如果有少数机器人团队标准化到打包替代方案,月流失率会逼近 3.0%。 | 项目转入生产后,月流失率维持在约 2.0%。 | 如果控制平面嵌进发布签核,月流失率会贴近 1.2%。 |
| 销售周期 | 从试点到生产的周期会从约 90 天拉长到 150 天。 | 付费 kickoff 后,大约一个季度内仍能从试点转到生产。 | 参考客户和标准集成包会把周期压到约 60 天。 |
| 毛利率 | 如果伙伴管理的数据工作仍占较大比重,毛利率会卡在 70% 左右。 | 到 Y3 毛利率爬到 70% 出头,稳态单位经济模型约为 73%。 | 如果摄取模板和 QA 工作流更快标准化,毛利率会走到 75% 左右。 |
| 招聘节奏 | 在 接入 模板还没证明前,3 个扩张岗位就提前了两个季度。 | 后期招聘仍压在后半程,并沿着商业计划里的顺序走。 | 最后 2 个岗位可以等到 Q3Y3 之后再补,而且不伤交付。 |
关键假设 (21)
| ID | 名称 | 数值 | 单位 | 来源 |
|---|---|---|---|---|
| A1 | 模型起始月份 | 2026-07 | YYYY-MM | [BP date 2026-06-19] 运营模型从带日期的商业计划之后的第一个完整月份开始。 |
| A2 | 期初现金 / pre-seed 融资 | $2.6M | 美元 | [BP fundingAsk targetFundingRangeUsd $2-4M + BP runwayMonths 18 + model cash trough] 较偏下但仍在中段的 pre-seed 融资额,能把公司带到 8-10 个项目的验证点,并留出大约 6 个月缓冲。 |
| A3 | 起始付费活跃项目数 | 0 | count | [BP milestones 0–12 个月] 公司从零收入起步,第一步必须先签下付费共创客户。 |
| A4 | 付费活跃项目定义 | 一个付费共创客户或生产试点单元 / 机器人项目,并纳入发布治理 | 定义 | [BP businessModel.unitOfValue + BP gtm.pricing] customersEop 统计的是付费项目,不是公司 客户总数。 |
| A5 | 项目爬坡 | M12 达到 4 个付费活跃项目,Q4Y2 达到 10 个,Q4Y3 达到 15 个 | customersEop | [BP milestones 0–12, 12–24, and 24–36 个月 + Research market.som] 基础情景对应 Y1 3–5 个付费共创客户、Y2 8–10 个生产项目,以及研究里约 15 个项目的第 3 年触达上限。 |
| A6 | 每个活跃项目的混合确认收入 | Y1 $180K/year,Y2 $235K/year,Y3 $245K/year | 美元/program/year | [BP gtm.pricing $40k-$60k design partner credited toward $180k-$250k 每年 license + variable fees + Research market.sam/som] 有效收入前期以试点为主,随后逐步走向研究中的混合 ACV 区间。 |
| A7 | 毛利率爬坡 | Y1 为 60%-68%,Y2 为 70%-72%,Y3 为 72%-74% | 毛利率百分比 | [BP businessModel.targetGrossMarginPct 70 + BP operatingAssumptions on standardized ROS2/video 接入] 早期部署会吃掉更多服务和伙伴转付成本,等软件路径可复用后,毛利率才会上来。 |
| A8 | 招聘时间线 | M1 创始人和创始工程师;M2 ML 负责人;M4 解决方案;M7 产品 / 运营;M8 第二名工程师;M11 第三名工程师和第二名 ML;M13 GTM;M17 第二名解决方案;M22 第三名 ML;M28 第二名产品 / 运营;M32 第四名工程师;M33 第二名 GTM;M35 G&A | 时间线 | [BP team + BP strategicChoices.sequencingRationale] 前 6 个岗位直接照计划走,后续岗位都往后半程压,以便在证明 接入 模板可复用前先守住 烧钱。 |
| A9 | 创始人总雇佣成本 | $140K | 美元/year | [BP team Founder CEO + startup-finance heuristic] 精简的创始人现金薪酬,加上工资税和福利。 |
| A10 | 平台工程总雇佣成本 | $190K | 美元/year | [BP team Founding eng + startup-finance heuristic] 假设是资深机器人基础设施人才,但现金水平低于大厂。 |
| A11 | ML / 数据基础设施总雇佣成本 | $210K | 美元/year | [BP team ML/data infrastructure lead + startup-finance heuristic] 反映出故障聚类和增益归因所需的资深人才水平。 |
| A12 | 解决方案工程总雇佣成本 | $170K | 美元/year | [BP team Solutions engineer + startup-finance heuristic] 假设有人能负责部署,但不预设一整支咨询型交付团队。 |
| A13 | 产品 / 运营总雇佣成本 | $165K | 美元/year | [BP team Product and operations lead + startup-finance heuristic] 覆盖发布工作流、伙伴 QA 和审计导出的 负责人。 |
| A14 | GTM 总雇佣成本 | $175K | 美元/year | [BP team GTM lead + startup-finance heuristic] 假设早期企业销售需要承担差旅和浮动薪酬负担。 |
| A15 | G&A 总雇佣成本 | $130K | 美元/year | [BP operations + startup-finance heuristic] 精简的财务、法务供应商和行政支持,直到 Y3 后段才补进来。 |
| A16 | 薪酬分摊到 P&L 科目 | 创始人 50% S&M / 50% G&A;解决方案 80% S&M / 20% R&D;工程和 ML 100% R&D;产品 / 运营 60% R&D / 40% G&A;GTM 100% S&M;G&A 100% G&A | 分摊 | [BP team rationales + BP operations] 把人员计划映射到下面这份按职能拆分的 P&L。 |
| A17 | 非薪资运营费用爬坡 | R&D $8K-$13K/月、S&M $6K-$12K/月、G&A $8K-$13K/月,覆盖整个 36 个月计划 | 美元/月nth | [BP product + BP operations + startup-finance heuristic] 覆盖云资源、差旅、保险、法务和伙伴 QA,不假设会大规模做付费 付费获客。 |
| A18 | 现金换算约定 | 现金变动等于 EBITDA | 公式 | [startup-finance heuristic] 默认在 pre-seed 阶段,税、债务服务、资本开支 和营运资本波动都不构成主要影响。 |
| A19 | 稳态月度流失率 | 2.0% | pct/月nth | [startup-finance heuristic for early enterprise workflow SaaS + BP market concentration risk] 这类工作流一旦嵌进去会比较粘,但买方过窄,因此流失率仍按保守口径处理。 |
| A20 | CAC 约定 | $95.6K = Y2 销售与营销支出 / 6 个净新增活跃项目 | 美元/新增活跃项目 | [model calc + BP gtm.funnelTargets] 第 2 年是首次能比较干净读取获客效率的阶段,因为第 1 年主要还在搭共创客户。 |
| A21 | 为融资定规模的下一轮里程碑 | 做到 5-7 个客户、8-10 个生产项目,把 接入 到第一版排序队列压到 10 个工作日以内,并在下一轮融资前至少证明一次第二项目扩单。 | 里程碑 | [BP milestones 12–24 个月 + BP fundingAsk.useOfFundsSummary + investorMemo.nextDiligence] 这是这轮融资试图带着缓冲跑到的 足以支撑 seed 融资 证明点。 |
flowchart LR Failures[Deployment failures + ROS2/video logs] --> Queues[Ranked retraining queues] Queues --> Programs[Active paid programs] Programs --> Revenue[Subscription + usage revenue] Revenue --> GrossProfit[Gross profit] GrossProfit --> Cash[Cash and runway]
警示项: 研究里的 SAM 只有约 90 个可触达滩头项目,所以 Q4Y3 做到 15 个活跃项目,本身就意味着已经拿下不小份额,容错空间并不大。 · customersEop 统计的是付费项目,不是独立客户 客户,因此 Y2-Y3 的一部分增长,默认来自现有账户里的第二项目扩单。 · 只有 ROS2 和视频 接入 足够标准化,模型才跑得到 70% 出头的毛利率;如果部署一直偏咨询型,公司要么得融更大一轮,要么得放慢招聘。 · 现金变动直接按 EBITDA 建模,没有单独拆 deferred revenue 节奏、capex 或营运资本波动。
主要风险
- 集成复杂度. 机器人日志、视频、遥操作和评测数据散落在杂乱的定制栈里,既拖慢导入,也会稀释到价值时间。 缓解措施: 先围绕一小组双臂试点工作流,把 ROS 和视频适配器打磨透;等一套可复用的集成模板跑通后,再扩连接器。
- 在位平台上探. 一旦这个切口被看见,XDOF 或其他机器人数据基础设施供应商都可能补上优先级管理和发布管理能力。 缓解措施: 坚持厂商中立,统一编排内部团队、遥操作伙伴和数据集供应商,让客户即便数据来源变化,也仍只用一套控制平面。
- ROI 归因偏弱. 客户可能很难证明任务成功率的提升究竟来自某一批数据,还是来自另一轮模型调参。 缓解措施: 每次采集冲刺都绑定前后对照的验收评测,首批合同也围绕“到重训时间”和单一任务族上的可测增益来签。
证据
引用来源 (40)
- XDOF. 关于——为机器人时代建设基础设施 · https://www.xdof.ai/about
- XDOF. XDOF 正式发布 · https://www.xdof.ai/blog/announcing-xdof
- International Federation of Robotics. 美国机器人产业重回两位数增长 · https://ifr.org/ifr-press-releases/news/robot-installations-rise-to-new-record-despite-global-challenges
- International Federation of Robotics. 工业机器人——定义、统计与案例研究 · https://ifr.org/industrial-robots
- Goldman Sachs. 人形机器人:比你想得更快到来 · https://www.goldmansachs.com/insights/articles/humanoid-robots.html
- CB Insights. 2024 年 Q2 AI 状态报告 · https://www.cbinsights.com/research/report/ai-trends-q2-2024
- Physical Intelligence. 我们的第一套通用策略 · https://www.pi.website/blog/pi0
- Figure. Project Go-Big:互联网规模的人形机器人预训练与直接人到机器人迁移 · https://www.figure.ai/news/project-go-big
- Google DeepMind. 在多种机器人类型上扩展学习 · https://deepmind.google/blog/scaling-up-learning-across-many-different-robot-types
- arXiv. Open X-Embodiment:机器人学习数据集与 RT-X 模型 · https://arxiv.org/abs/2310.08864
- arXiv. DROID:大规模真实世界机器人操作数据集 · https://arxiv.org/abs/2403.12945
- arXiv. 用低成本硬件学习细粒度双臂操作 · https://arxiv.org/abs/2304.13705
- arXiv. Mobile ALOHA:用低成本全身遥操作学习双臂移动操作 · https://arxiv.org/abs/2401.02117
- Hugging Face. LeRobot 社区数据集:机器人的“ImageNet”何时到来、又该如何实现? · https://huggingface.co/blog/lerobot-datasets
- arXiv. OpenVLA:开源视觉-语言-动作模型 · https://arxiv.org/abs/2406.09246
- arXiv. GR00T N1:面向通用人形机器人的开放基础模型 · https://arxiv.org/abs/2503.14734
- Foxglove. 机器人正在吞下软件没能吃下的世界 · https://foxglove.dev/blog/foxglove-series-b
- Foxglove Docs. Foxglove 文档 · https://docs.foxglove.dev/docs
- InOrbit. InOrbit 产品套件的演进发布 · https://www.inorbit.ai/blog/announcing-the-evolution-of-inorbits-product-suite
- InOrbit. Ground Control · https://www.inorbit.ai/groundcontrol
- Formant. Physical AI:实践者视角 · https://formant.io/notes/physical-ai-the-practitioner-s-view
- Formant. 首页——物理世界的 Jira · https://formant.io/
- Scale AI. 具身 AI · https://scale.com/physical-ai
- OSHA. 机器人——概览 · https://www.osha.gov/robotics
- OSHA. 机器人——危险识别 · https://www.osha.gov/robotics/hazards
- European Commission. AI 法案 · https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai
- NIST. 人工智能风险管理框架(AI RMF 1.0) · https://www.nist.gov/publications/artificial-intelligence-risk-management-framework-ai-rmf-10
- GitHub. ros2/rosbag2 · https://github.com/ros2/rosbag2
- GitHub. google-research/rlds · https://github.com/google-research/rlds
- MCAP. MCAP · https://mcap.dev/
- Hugging Face. LeRobotDataset v3.0 · https://huggingface.co/docs/lerobot/lerobot-dataset-v3
- SIMPLER. 在仿真中评估真实世界机器人操作策略 · https://simpler-env.github.io/
- GitHub. Lifelong-Robot-Learning/LIBERO · https://github.com/Lifelong-Robot-Learning/LIBERO
- GitHub. ARISE-Initiative/robomimic · https://github.com/ARISE-Initiative/robomimic
- GitHub. Physical-Intelligence/openpi · https://github.com/Physical-Intelligence/openpi
- GitHub. openvla/openvla · https://github.com/openvla/openvla
- GitHub. octo-models/octo · https://github.com/octo-models/octo
- CUPID. CUPID:用影响函数策展机器人偏好的数据 · https://cupid-curation.github.io/
- COBALT. COBALT:通过基于云的智能手机遥操作众包机器人学习 · https://cobalt-teleop.github.io/
- UMI. 通用操作接口:不用真实世界机器人也能做真实世界机器人教学 · https://umi-gripper.github.io/