给 AI 编码团队用的运行时 broker,把测试和生成代码放进带签名、可审计的 sandbox,在割裂的云容量之间调度。
当编码 agent 不再只是补全代码,而是开始直接写 PR,它们就必须进到真实执行环境里跑 build、集成测试、浏览器检查,以及生成代码的实际执行。多数企业现在是把自建 CI runner、单一 runtime 供应商和脆弱的安全审查硬拼在一起,结果就是队列高峰更频繁、环境不一致,也没人敢放心让不受信任的 agent 代码碰到高权限系统。最后形成的瓶颈很直接:团队不是为了少数高峰提前买一堆闲置容量,就是在 agent 真正进入生产工作流前先把采用速度压下来。
为何现在
- 企业采用 AI 编码,已经在制造一类新的高 runtime 强度工作负载,而不只是多几次聊天调用。
- 买方现在开始在意 AI 生成代码能否安全执行,因此隔离 sandbox 不再是加分项,而是必备原语。
- 尖锐的容量短缺和 13 家合作方组成的供应链,让多 provider brokerage 的价值突然变得很实,因为对单一供应商的依赖已经开始失灵。
- Modal 的估值重估说明,资本市场预期 agent runtime 这一层会长成独立大类,因此仍给聚焦型的中立 broker 留了空间。
催化因素。 正是这波把 Modal 从 $60M ARR 推到 $300M ARR、并逼着它接 13 家基础设施伙伴的企业 AI 编码浪潮,也在逼买方立刻补上“多 provider、策略安全”的执行层;否则单一供应商很快就会成为瓶颈。
创意
产品夹在编码 agent 与基础设施 provider 之间,既是控制平面,也是执行层。开发者或平台团队先定义好批准过的基础镜像、secret 边界、网络策略和成本上限;随后 broker 会按延迟、合规和实时容量,把每个任务拉起到最合适的 provider 上,并放进带签名的 sandbox 里执行。它还能把 build layer 和测试产物的缓存跨 provider 复用,所以面对突发高峰时,成本和速度都比简单做云容灾更好。每次运行都会留下可回放的轨迹,说明执行了哪段代码、调用了哪些工具、暴露了哪些 secret、以及最终跑在哪个 provider 上。这让产品同时能打动两类人:一类想把 agent 扩到更多团队的平台团队,另一类是不愿盲信 agent 的安全团队。
差异化。 传统 CI 厂商管的是可信开发者工作流和固定 runner;serverless GPU 云卖的是裸执行容量。这家公司要解的是另一个控制问题:如何为不受信任的 AI 生成代码,同时做好策略执行、可复现的 sandbox 打包,以及实时容量 brokerage。时间一长,它还能沉淀出跨 provider 的可靠性与价格地图,知道什么工作负载该往哪儿路由,这层路由智能会越来越难替代。
| 滩头市场 | 先打 500-2,000 名工程师规模的 Series C+ B2B SaaS 公司:它们已经批准后端团队使用内部编码 agent,现在需要让每个 agent 生成的 PR,都在合规网络边界内跑完集成测试、浏览器检查和临时预览环境。 |
|---|---|
| 切入点 | 做一个具备策略感知的 runtime broker:把每个 agent 任务都封进带签名的临时 sandbox,在多家已批准的云之间调度 CPU 和 GPU 步骤,并返回可审计的执行轨迹与 warm-cache 复用。 |
| 非显而易见洞察 | AI 编码里真正稀缺的资产,不只是 GPU 时间,而是那些已经过策略审批、又能复现的不受信任 agent 代码执行槽位。Modal 证明了市场正在爆发,也证明 sandbox 这类安全原语很关键,因此给一个中立 runtime broker 留出了空间:它能把割裂的云容量真正变成企业可用的编码工作负载。 |
| 风险投资级路径 | 先从编码 agent 的 build 与测试执行切入,再往外扩成通用执行层,覆盖支持 agent、数据 agent、模型评测任务,以及需要隔离式突发算力、策略控制和审计能力的受监管内部自动化流程。 |
| 主要用户 | 一家拥有 500-2,000 名工程师的 B2B 软件公司里,负责推动内部编码 agent 落地的平台主管工程副总裁或 AI 平台负责人 |
|---|---|
| 次要用户 | 负责 CI、预览环境和策略执行的资深开发者效率工程师 |
| 经济买方 | 平台主管工程副总裁,或由 CIO 主导的内部 AI 平台 owner |
| 首个客户 | 首个客户会是垂直 SaaS 公司里负责平台工程的 VP,团队规模约 700-1,500 名工程师,已经正式把 Claude Code 或类似内部编码 agent 推给后端团队,并开始看到 agent 生成的 PR 把 CI 队列打满。 |
|---|---|
| 购买触发点 | 一次内部 agent 推广从 pilot 扩到多支团队后,测试队列延迟、安全审查摩擦,或发布周的突发算力超支突然集中爆发。 |
| 当前替代方案 | 自建 GitHub Actions runner、单云 sandbox 供应商,以及套在现有 CI 流程外面的人工策略审查。 |
| 切换理由 | 这个 broker 能同时给他们爆发容量、可审计的隔离能力和 provider 冗余,而不必提前囤 GPU,也不必自己重造一套 CI 与 sandbox 栈。 |
| 定价假设 | 按 sandbox 分钟和缓存产物收费;对大型企业再叠加预留容量包和合规策略包。 |
待完成任务
| 任务 | 当前替代方案 | 成功指标 |
|---|---|---|
| 当编码 agent 开始跨多支团队生成 PR 时,帮平台负责人把每次 build 和集成测试都放进已批准的 sandbox 里跑完,这样他们就能在不炸掉 CI 可靠性和安全审查的前提下,把 agent 扩到更多生产工作流。 | 自建 runner,以及人工维护的 sandbox 环境 | agent 生成任务的排队时间降低 50%,同时做到完整审计覆盖 |
| 当发布周把 agent runtime 需求推到高峰时,帮开发者效率团队把工作负载路由到多个已批准的 provider 上,这样他们就能在不囤闲置峰值容量的情况下,把延迟守在可预测范围内。 | 单云过度扩容,再加上人工故障切换 | 在目标延迟和策略合规前提下,把突发算力成本压低 30% |
flowchart LR Buyer[VP Platform Engineering] --> Pain[Agent PRs overload CI and raise sandbox risk] Pain --> Product[Policy-aware burst runtime broker] Product --> Outcome[Faster agent rollout with auditable multi-cloud execution]
- 信号 · 5/5来自原始来源的收入和估值数据,说明这已经是一个真实且增长极快、并直接绑定企业 AI 编码的工作负载品类。
- 痛点 · 4/5容量瓶颈和不安全的代码执行,已经痛到足以挡住 agent 推广;只是还有部分买方会先靠现有 CI 体系硬撑。
- 切入点 · 5/5第一款产品定义得很窄:专做 agent 生成的 build、测试和预览任务的 sandbox 化多 provider 执行。
- 防御性 · 4/5跨 provider 遥测、策略集成和执行历史,会逐步叠加成持久的路由与信任优势。
- 规模化 · 5/5滩头市场能从编码 agent 外溢到更广泛的企业 agent runtime 与受控突发算力市场。
- serverless runtime 供应商
- 云与 GPU 基础设施伙伴
- 编码 agent 与 CI 生态厂商
- 在多家 provider 间做工作负载路由与调度
- 维护安全的 sandbox 模板和策略引擎
- 按工作负载类型衡量性能、可靠性与成本
- 运行时编排控制平面
- provider 集成与容量遥测
- sandbox 镜像目录与执行轨迹数据
- 不用自备闲置 GPU/CPU 池,也能吃下 agent 工作负载的爆发容量
- 每次 agent 运行都带签名、可复现,并留下审计轨迹的 sandbox
- 跨 provider 路由,降低供应商锁定和发布周的容量瓶颈
- 以高触达方式完成上线,配套策略模板
- 先拿下一条工作流,再扩到更多 agent 场景
- 持续做优化复盘,围绕成本和排队时间节省交付价值
- 直接销售给平台工程负责人
- 与编码 agent 厂商和云市场建立合作
- 和 AI-native 软件公司做共创客户 pilot
- 正在推内部编码 agent 的企业平台团队
- 负责 CI 和预览环境的开发者效率团队
- 审批 AI 编码执行策略的安全团队
- 云与 provider 的直通成本
- 安全工程与合规运营
- 企业销售与解决方案工程
- 按 sandbox 分钟收费
- 对预留且合规的爆发容量额外收费
- 年度企业合同,出售策略包与审计导出能力
市场
| TAM | $1.1B 估算逻辑是:全球约 10,000 家中大型软件团队 × 每队 750 名工程师 × 70% 活跃 AI 编码使用率 × 每名活跃工程师每年约 $210 的受治理 runtime 支出(约等于每周 10 个 agent 任务 × 每次 20 分钟 × 综合约 $0.02/分钟的公开 sandbox 与 runner 价格)。交叉校验后,邻近的 AI code tools 市场预计到 2028 年可达 $12.6B。 |
|---|---|
| SAM | $264.6M 滩头市场测算:北美和欧洲约 2,000 家 500-2,000 人规模的 B2B 软件公司 × 900 名工程师 × 70% 活跃 AI 使用率 × 约 $210 年支出。 |
| SOM | $7.9M 第 3 年可触达情形:45 家客户 × 900 名工程师 × 70% 活跃 AI 使用率 × 针对高合规、重突发工作负载约 $280 的年支出。 |
高管要点
- AI 编码正在把基础设施需求从静态 CI 容量,推向可治理的执行环境——后者专门承接不受信任的 agent 生成代码。
- 买方缺的并不只是裸算力,而是已过策略审批的爆发容量、可溯源能力,以及跨多家 provider 的网络安全执行层。
- 现有厂商分散在 CI 在位者、点状 sandbox runtime 和 CI 加速层三类里,给一个中立的治理与路由 broker 留出了空白。
- 创业公司只有把“安全吞吐”和“多云可靠性”卖出去,而不是沦为更便宜的 runner 池,才有机会赢。
市场定义
面向 AI 编码与 agent 工作流的受治理执行基础设施:它负责把编码 agent 触发的 build、测试、浏览器检查和生成代码任务打包、调度、隔离,并拿出可证明的执行结果。
用户与买方
最核心的使用者,是负责 CI、runner 策略、网络边界和 secret 管理的平台团队或 AI 基础设施团队。经济买方通常是平台主管工程 VP 或相近的内部 AI 平台 owner;因为工作负载里包含不受信任的 agent 生成代码,所以安全与合规团队会共同审批。
购买触发点
- 当 agent 生成的 PR 开始与人工编写的 CI 共享同一批 runner 池时,平台团队会明显感到排队、编排和清理工作正在拖累可靠性。 [20][21][22][26][31]
- 一旦工作负载里包含不受信任的 agent 代码,安全审查就会陡然升级,因为 secret、出网和宿主复用都会变成采购卡点。 [25][28][39][43][48]
- 发布周、评测批处理和多分支 rollout 会制造爆发需求,而单一 runner 池或单一云都不适合吃这种尖峰。 [1][2][31][35]
支付意愿
直接替代方案已经把“按用量为受治理执行付费”这件事正常化了:E2B 和 Daytona 都公开了约 $0.000028/秒的 2-vCPU sandbox 定价,Depot 公布 2-vCPU GitHub Actions runner 为 $0.004/分钟,Modal 则按秒收 core 和 GiB 费用。只要 broker 能在这条基线之上,把排队、闲置峰值容量和安全审查人力明显降下来,它的付费逻辑就站得住。 [3][11][14][15]
品类动态
顺风因素
- 开发者对 AI 的使用已经足够广,未来会有更多软件工作先由 agent 创建、测试和审阅,而不只是由人工完成。
- 编码 agent 产品越来越强调自己能跑测试、执行命令和创建 PR,这意味着执行基础设施正变成产品表面的一部分。
- 溯源、attestation 和临时构建环境的最佳实践,正在为“受治理执行层”提供强叙事支撑。
逆风因素
- 信任、隐私和代码质量问题,依然会拖慢企业对 AI 编码工具的推广。
- 平台团队正被要求收缩工具栈,因此任何新的控制平面厂商都必须跨过更高门槛。
- 通用托管构建服务和托管 runner,已经足以满足大量买方的需求,因此他们完全可能推迟新采购。
验证信号
- Modal 表示 sandboxes 已贡献超过三分之一收入,平台累计启动超过 10 亿个 sandbox,说明 runtime 需求不是 demo 级别,而是实打实的线上需求。
- Claude Code 明确宣传自己能读代码、跑测试和开 PR,这意味着执行基础设施已成为 agent 产品表面的一部分。
- Codex 也把 git、包管理器和测试 runner 等子命令放进同一层 sandbox 边界里,说明执行控制本来就是 agent 编码产品的核心组件。
- JetBrains 2026 AI Pulse 显示,90% 的开发者在工作中至少使用一种 AI 工具,74% 使用专门的 AI 开发工具,未来需求底盘会继续扩大。
监管与技术约束
- 只要生成代码会碰到云资源或内部系统,短时凭证与最小权限访问就是入场券。
- 溯源与签名 attestation 正在成为构建产物和 SBOM 的默认控制面。
- 在多租户环境里执行不受信任代码时,共享企业环境往往需要比默认容器更强的隔离。
- 为了降低污染与可复现性风险,临时构建环境正越来越取代可复用宿主机。
竞争
竞争大体分成三堆:Git 为中心的 CI 在位厂商、专门做 sandbox 的 runtime,以及 CI 加速厂商。真正的白地带,是一层中立治理层,能跨这些栈去做路由,而不是强迫客户整套替换。
| 竞争对手 | 阶段 | 切入点 | 定价 | 优势 | 相对劣势 |
|---|---|---|---|---|---|
| GitHub Actions | incumbent | 通用 CI/CD,提供 hosted、larger 和 self-hosted runner。 | 托管用量计费并额外收存储费;self-hosted runner 软件本身免费,但基础设施和运维都由买方承担。 | 工作流嵌入深、与 GitHub 原生集成,且开发者认知最强。 | 它仍让买方在受限 hosted 容量、付费大 runner 和自建 ARC 复杂度之间二选一;默认也不给中立的多云 brokerage。 |
| Modal Sandboxes | scale-up | 面向 agent 与强化学习工作负载的 serverless GPU 与 sandbox runtime。 | 按秒收 CPU 和内存费用,并提供每月免费算力额度。 | 在 agent 场景里可信度高,sandbox 执行规模大,AI 基础设施能力也深。 | 它仍是单一 provider runtime,而不是跨已批准云和既有 CI 体系的中立 broker。 |
| E2B | scale-up | 基于 Firecracker 的 AI sandbox,通过 SDK 和开源交付。 | 有免费层;Pro 为 $150/月 加用量费,默认 2-vCPU 单价按秒公开。 | 接入路径快,在 agent 开发者里品牌强。 | 它更适合嵌一个 sandbox 进去,而不是在企业场景里编排策略、做多 provider 路由或跨云审计控制。 |
| Daytona | scale-up | 给 AI agent 提供有状态 sandbox 与 computer-use 基础设施。 | 按秒公开计算与内存价格,并附带较大免费额度。 | 启动很快,且 workspace/computer-use 故事比纯代码执行更宽。 | 它的重点仍是 runtime/workspace,而不是中立执行 brokerage、溯源和异构云容量优化。 |
| Depot | scale-up | 在托管基础设施上提供更快的 GitHub Actions runner、远程构建和 agent 友好的 CI。 | 订阅加用量计费;GitHub Actions runner 起价 $0.004/分钟,agent sandbox 另行计费。 | CI 提速 ROI 清楚,从 GitHub Actions 迁过去的摩擦也低。 | 它优化的是自家托管 runner 栈,而不是在统一策略层下跨多家 execution provider 做套利和路由。 |
为什么现有厂商不会默认胜出
- 云构建服务. hyperscaler 的构建服务能减少 runner 运维,但它们天然绑定单一 provider;默认并不能解决跨多云的中立路由,也做不到在既有 CI 体系上统一策略。
- Git 型 CI 平台. GitHub 一类的 CI 已经深度嵌进开发流程,但面对爆发式 agent 流量,团队仍得在受限的托管容量、付费大 runner 和自建 ARC 复杂度之间做取舍。
- Sandbox 专业厂商. 点状 sandbox 厂商把安全执行这件事做得不错,但它们大多仍是单一 runtime,而不是能跨已批准云、企业网络和既有 CI 控制层做中立 brokerage 的平台。
- CI 加速厂商. CI 加速厂商证明了买方愿意为更快执行付费,但它们优化的是自己托管的 runner 栈,而不是在异构 execution provider 之间做受策略治理的路由。
商业计划
Agent Runtime Burst Broker 的第一站,不该是替代 GitHub Actions、云构建服务或某家 sandbox 厂商,而应当先做一层受策略约束的溢出执行层,卖给那些已经把内部编码 agent 推开、现在又被 agent 生成 PR 挤爆 CI 队列的 500-2,000 人 B2B 软件团队。第一款产品的边界要很清楚:只拦截 agent 触发的 build、集成测试、浏览器检查和部分生成代码任务,把它们封进带签名的临时 sandbox,再在已批准的 provider 之间路由,并留下可回放的审计轨迹。这个滩头故意做窄,因为一旦同一个平台团队已经在发布周扛排队高峰、安全审查摩擦和突发容量超支,买方、触发点和 ROI 就最清楚。按研究测算,只要公司先守在中大型软件团队,就有约 $1.1B TAM、$264.6M 初始 SAM 和 $7.9M 的第 3 年 SOM,之后还能往更广的 agent runtime 工作负载扩。GTM 也别卖“更便宜的算力”,而要卖安全吞吐和爆发可靠性:用付费 BYOC pilot 证明排队时间下降、执行轨迹完整、采购更容易过。只有当公司能成为在位厂商天然不给的那层“中立治理与路由层”,跨既有 CI 体系和多朵云同时成立,才有机会赢。最关键的反证风险也很明确:只做 overflow 也许撑不起预算;在位厂商也可能把相近的策略能力打包进去;早期买方还可能一上来就要求 GPU、浏览器或 VPC 能力,超出初始工作负载范围。因此,前 12 个月必须证明三件事:买方愿不愿为 agent 专用执行池付费,BYOC 能否明显缩短安全审查,以及跨 provider 路由在延迟、成本或审批时间上,能否真胜过单一供应商基线。
问题
- 随着内部编码 agent 从给建议走到直接创建 PR,agent 生成的 build、集成测试和浏览器检查开始与人工 CI 抢同一批 runner,而现有 runner 池根本不是按这种高峰设计的。
- 只要不受信任的 agent 代码需要接触高权限系统,安全与合规团队就不会轻易放行;他们要的是隔离、可审计,以及明确绑定网络、secret 和溯源控制的执行环境。
解决方案
- 在编码 agent 与执行基础设施之间插入一个具备策略感知的控制平面,让每个 agent 任务都运行在带签名的临时 sandbox 里,并强制使用批准过的基础镜像、短时凭证、明确的出网规则和可回放的执行轨迹。
- 把 CPU、浏览器、以及后续 GPU 工作负载路由到多家已批准的 provider,上线第一步只做 agent 专用 overflow 池,和客户现有 CI 工作流并存,而不是一上来就推翻重建。
为什么我们会赢
- GitHub Actions、云构建服务和 sandbox 厂商各自都只覆盖工作流的一部分,但没有谁天然拥有跨多 provider、跨客户既有 CI 体系的中立治理、溯源和路由层。
- 每一次线上运行,都会继续沉淀工作负载形态、冷启动、失败模式、缓存行为和策略结果的数据;这会让路由质量和审计能力比单一 provider runtime 更快迭代。
| 滩头市场 | 先打北美和欧洲的 B2B 软件公司:团队规模 500-2,000 人,CI 以 GitHub 为中心,后端团队已经正式启用内部编码 agent,而且 PR 与测试量已经足以把 runner 容量打满。 |
|---|---|
| 切入点理由 | agent 专用 overflow 执行池,比整套 CI 替换更容易更快证明价值:买方已经在感受新的爆发问题,部署也能挂在现有流程旁边,安全故事在“明确不受信任的 agent 代码”这个场景下也最站得住。 |
| 推进顺序 | 先做 BYOC、带签名的 sandbox、审计轨迹和面向 CPU 型 build/集成测试 overflow 的策略执行,因为采购最先卡的就是这些控制点,而这条路线的供应链复杂度也低于一开始就铺开多 runtime 平台。等付费 pilot 证明“路由 + 治理”能过安全审查并转成年约后,再补浏览器自动化、有限 GPU 路由,以及更深的 provider 优化。 |
| 暂不进入 | 在 agent 专用切口还没反复转化之前,不做全量 CI/CD 替换 · 在编码 agent 执行还没形成标杆前,不做通用支持 agent、数据 agent 或后台自动化工作负载 · 在没有明确人工与策略审批闸门前,不做直接对生产系统的自主执行 · 在 pilot 轨迹还没证明 GPU 占比足够高前,不走 GPU-first 产品路线 |
| 切入点 | 卖一层只服务 agent 的、受策略治理的 overflow 池,让平台团队可以放大编码 agent 的使用,而不用重造 CI,也不用让安全团队去盲信黑盒 sandbox 厂商。 |
|---|---|
| 渠道 | 由创始人直接销售给平台主管工程 VP、AI 平台负责人和开发者效率负责人 · 通过已采用编码 agent 的团队、平台工程圈子,以及围绕 CI 饱和事件的高参考价值 outbound,拿下共创客户 pilot · 在拿到 pilot 证明后,再做和编码 agent 厂商、云市场,以及精选安全或 DevOps 咨询公司的集成与联合销售 |
| 漏斗目标 | 目标账户→有效需求沟通 15-25%,有效需求沟通→付费 pilot 20-30%,付费 pilot→年度生产合同 50%+,生产客户→12 个月内扩到第二条工作流或第二支团队 40%+。 |
| 定价 | 先卖 8-12 周、价格约 $25k-$50k 的付费 pilot;转生产后,收年度平台承诺费,再叠加按 sandbox 分钟和缓存/存储计量的用量费。对滩头市场来说,目标 ARR 通常是 $80k-$180k,因为买方买的是受治理的吞吐、可审计性,以及避免闲置峰值容量,而不是按席位付费。 |
| MVP | MVP 应支持 agent 触发的 build、集成测试和部分浏览器检查,作为一层 overflow 执行池接入既有 GitHub 为中心的工作流。首版必须包含带签名的 sandbox 模板、策略配置、短时凭证、可回放的执行轨迹,以及至少两家以 CPU 为主的已批准 provider 路由;人工编写的 CI 和大多数生产发布逻辑先不动。 |
|---|---|
| 6 个月 | 在 6 个月内交付 2-3 个付费 BYOC pilot:支持 GitHub 触发的 agent 任务拦截、带签名的 sandbox 模板、审计日志、CPU 工作负载路由,以及能证明排队时间和采购价值的缓存复用指标。 |
| 12 个月 | 补上浏览器自动化、VPC 和静态出网选项、常见企业控制的策略模板,以及只面向确有需求 pilot 账户的有限 GPU 路由;同时至少把 2 个 pilot 转成年约生产合同。 |
| 24 个月 | 把产品从 agent overflow 执行层,扩成更广的受治理 runtime 层,覆盖编码、评测和相邻内部 agent 工作负载,并继续增强路由智能、跨 provider 基准能力,以及面向受监管环境的策略包。 |
| 关键押注 | 只做 overflow 的部署,会比一上来迁整套 CI 更容易成交。 · BYOC 加短时凭证,足以让早期企业客户过安全审查,而不用一开始就做完全 customer-hosted 的控制平面。 · 早期需求主要集中在 CPU 与浏览器工作负载,因此 GPU 支持可以等到验证后再补,而不是一开始就决定产品。 · 跨 provider 路由和缓存复用,能在排队时间或成本上,对比单一 provider 基线做出可量化改进。 |
| 收入来源 | 年度平台订阅费,覆盖策略引擎、路由控制平面、审计导出和 provider 治理 · 按 sandbox 分钟、缓存消耗和高级爆发容量收取用量费 · BYOC 部署、合规控制以及后续私有网络或受监管环境能力的高级套餐 |
|---|---|
| 价值单位 | 纳入治理的 agent 执行任务和 sandbox 分钟 |
| 目标毛利率 | 70% |
| 扩张杠杆 | 在同一客户内部覆盖更多团队、仓库和 agent 工作流 · 为 VPC 接入、静态出网、溯源导出和受监管部署模式出售高级控制能力 · 从编码 agent overflow 扩到评测任务、浏览器密集型 QA,以及相邻的受治理内部 agent 工作负载 |
| 北极星指标 | 在生产 SLA 下,运行于策略批准 sandbox 中的 agent 生成任务月执行量 |
|---|---|
| 输入指标 | agent 生成任务的中位排队时间下降幅度 · pilot 转生产的转化率 · 拥有完整溯源与策略证据的运行占比 · 被路由工作负载的缓存命中率 · 使用超过一家已批准 provider 的生产客户占比 · 从第一条工作流扩到第二条工作流的 12 个月内转化率 |
| 待构建护城河 | 覆盖成本、延迟、失败率和冷启动行为的跨 provider 遥测图谱,并按工作负载类型细分 · 把策略决策、身份、provider 选择和审计结果串起来的执行轨迹数据集 · 一套可复用的企业策略模板和 onboarding 模式,让 agent 安全执行能嵌进既有 CI 体系 |
| 终止标准 | 如果前 10 个合格 ICP 账户里,不到 3 个愿意为 overflow-only 部署买单,就该重看切口,或者直接止损。 · 如果前 3 个付费 pilot 无法把 agent 任务中位排队时间至少降 30%,或无法证明 BYOC 与审计控制能带来采购优势,就暂停扩张。 · 如果超过一半的 pilot 工作负载都需要当前不支持、且会实质改写架构的 GPU、浏览器或网络能力,就该收窄 ICP 或重排路线图。 |
里程碑
- 完成 20 次 ICP 与安全访谈,拿到 5-8 个共创客户,并把第一条工作流收窄为 agent 生成的 build、集成测试与浏览器检查 overflow。
- 交付一个带签名 sandbox 的 MVP,支持 BYOC 部署、策略控制、审计导出,以及至少两家已批准 provider 的路由。
- 拿下至少 2 个付费 pilot,并把其中至少 1 个转成年约生产合同。
- 建立一套成文的 provider 评分卡与工作负载分类法,用来指导 CPU、浏览器和 GPU 的路线图。
- 在滩头市场做到 8-12 个生产客户,部署周期控制在 45 天以内,并拿下至少两次可引用的安全审查通过案例。
- 上线浏览器支持、在必要处提供选择性 GPU 路由,并为私有网络和高溯源要求买方交付可重复策略包。
- 证明既有客户会把产品扩到第二条工作流、第二支团队或更多 provider 配置。
- 从编码 agent overflow 扩成更广的受治理 runtime 层,覆盖相邻内部 agent 工作负载。
- 沉淀出有防御性的路由与审计数据集,持续改善赢单率、毛利率和与 provider 的议价能力。
- 把公司树成企业 agent 执行的中立治理层,而不是某个点状 sandbox 或 runner 厂商。
flowchart LR Wedge[Agent-only overflow wedge] --> MVP[Signed sandbox MVP] MVP --> Proof[Queue and audit proof] Proof --> Expansion[Broader governed runtime]
创始团队
| 角色 | 入职时间 | 理由 |
|---|---|---|
| 创始人/CEO | 第 0 个月 | 负责共创客户销售、定价、采购推进和伙伴拓展,因为当前最核心的风险是 ICP 与预算验证。 |
| 创始工程师 | 第 0 个月 | 搭起控制平面、provider 适配层、带签名的 sandbox 模板,以及 pilot 需要的审计轨迹管线。 |
| 安全 / 平台工程师 | 第 3-6 个月 | 把 OIDC、策略控制、溯源导出和 BYOC 部署模式产品化,避免安全审查长期停留在创始人手工定制。 |
| 产品 / 解决方案工程师 | 第 6-9 个月 | 把 pilot 集成、工作负载打点和客户 onboarding 沉淀成可重复部署模板。 |
| GTM 负责人 | 第 9-12 个月 | 等公司拿到可引用的付费 pilot 与可信转化故事后,再放大 outbound 与合作渠道。 |
实验路线图
| 阶段 | 实验 | 假设 | 成功指标 | 负责人 |
|---|---|---|---|---|
| 0–90 天 | 访谈 15 位目标平台负责人,以及 5 位已经在推编码 agent 公司的安全相关方。 | 真正打开预算的,不是团队“试过 AI 编码”,而是 agent 生成的工作负载已经带来排队和采购摩擦。 | 至少 10 个目标账户描述出明确触发点,且至少 5 个愿意共享 runner、队列或安全审查数据。 | 创始人/CEO |
| 0–90 天 | 做一轮 concierge 式 pilot 模拟:把某个客户的 agent 生成任务封进带签名的 sandbox,并对比当前基线与路由后的排队时间。 | 只做 overflow 的部署,也能在不替换现有工作流的前提下,带来可见的吞吐提升。 | 至少 1 个共创客户认可这条工作流,并在模拟或受控生产流量下看到 20% 以上的排队时间改善。 | 创始工程师 |
| 0–90 天 | 向早期共创客户测试 3 套采购包,组合方式围绕 BYOC、审计导出和短时凭证。 | 只要产品被包装成“运行在客户云边界内的受治理执行层”,采购推进就会更快。 | 至少 3 个潜在客户明确指出更偏好的安全包,且没有人要求使用无人管理的长期 secret。 | 创始人/CEO |
| 90–180 天 | 把 2-3 个共创客户转成付费 BYOC pilot,只覆盖一条线上 agent 生成工作流。 | 平台团队会先为一条 overflow 工作流付费,再考虑更广的 runtime 标准化。 | 至少签下 2 个单价 $25k+ 的付费 pilot,且至少 1 个在真实使用里把排队时间压低 30%。 | 创始人/CEO |
| 90–180 天 | 按 CPU、浏览器、GPU、网络和驻留要求,给 pilot 账户的工作负载轨迹打点。 | 只要 CPU 与浏览器任务占据高价值需求的大头,初始路线图就能继续聚焦。 | 拿到覆盖至少 1,000 个任务的 pilot 数据集,用它判断主工作负载结构,并决定 GPU 支持是否继续后置。 | 产品/工程负责人 |
| 180–360 天 | 在至少两家已批准 provider 上线生产级路由,配好共享缓存策略和 provider 评分卡。 | 跨 provider 遥测和缓存摆放,足以明显提升可靠性与突发效率,从而推动转化与扩张。 | 至少 2 个生产客户同时使用两家 provider,并确认相较原来的单一 provider 方案,在性能、韧性或成本上有可见收益。 | 产品/工程负责人 |
| 180–360 天 | 测试 1 条集成或联合销售渠道,对象可以是编码 agent 厂商、安全咨询公司或云市场。 | 只要首批 pilot 已有可引用的证明,合作渠道就能带来更高意向度的 pipeline。 | 至少拿到 3 个通过单一合作渠道稳定导入的合格机会。 | GTM 负责人 |
风险评估
- R1GitHub、Modal、Depot 或 hyperscaler 可能在现有产品里打包足够多的策略与突发路由能力,把 broker 的切口压窄。 — 聚焦中立的跨 provider 治理、与既有 CI 共存,以及单一 provider 天生难以提供的审计可移植性。
- R2即便是 BYOC 模式,安全团队也可能拒绝第三方路由层,因为他们仍觉得溯源、secret 或网络控制不够。 — 从第一批 pilot 起就主打 BYOC、短时凭证、明确的出网策略、可回放轨迹,以及客户指定的证明材料。
- R3真实的早期工作负载,可能比预期更偏 GPU、更偏浏览器,或更受网络约束,导致计划中的 MVP 架构不够用。 — 尽早给 pilot 轨迹打点,收窄 ICP,并在工作负载分类真正测出来前,不轻易做宽泛承诺。
- R4平台团队也可能选择继续优化现有 GitHub 或自建 runner,而不是再买一层新的控制平面。 — 只向已有明显排队与采购痛感的账户销售,坚持要求付费 pilot,并把 ROI 同时对比 runner 成本与安全审查人力。
| 风险 | 可能性 | 影响 | 缓解措施 |
|---|---|---|---|
| GitHub、Modal、Depot 或 hyperscaler 可能在现有产品里打包足够多的策略与突发路由能力,把 broker 的切口压窄。 | Medium | High | 聚焦中立的跨 provider 治理、与既有 CI 共存,以及单一 provider 天生难以提供的审计可移植性。 |
| 即便是 BYOC 模式,安全团队也可能拒绝第三方路由层,因为他们仍觉得溯源、secret 或网络控制不够。 | High | High | 从第一批 pilot 起就主打 BYOC、短时凭证、明确的出网策略、可回放轨迹,以及客户指定的证明材料。 |
| 真实的早期工作负载,可能比预期更偏 GPU、更偏浏览器,或更受网络约束,导致计划中的 MVP 架构不够用。 | Medium | Medium | 尽早给 pilot 轨迹打点,收窄 ICP,并在工作负载分类真正测出来前,不轻易做宽泛承诺。 |
| 平台团队也可能选择继续优化现有 GitHub 或自建 runner,而不是再买一层新的控制平面。 | Medium | High | 只向已有明显排队与采购痛感的账户销售,坚持要求付费 pilot,并把 ROI 同时对比 runner 成本与安全审查人力。 |
| 标题 | 一家 900 人垂直 SaaS 公司的平台主管工程 VP |
|---|---|
| 画像 | 这是一家以 GitHub 为中心的 B2B 软件公司,已经把 Claude Code 或类似内部编码 agent 推给后端团队,现在 agent 生成的 PR 检查与集成测试正在把发布周 runner 容量压满。 |
| 触发点 | 一次 agent 推广从 pilot 扩到多支团队后,CI backlog、云超支,或“生成代码如何执行”的安全审查突然成为卡点。 |
| 买方 | 平台主管工程副总裁 |
| 初始合同 | 先签一笔 8-12 周、约 $25k-$50k 的付费 BYOC pilot,只覆盖一条 agent 生成工作流;等排队时间与审计目标达成后,再抵扣进 $80k-$180k 的年度生产合同,并叠加按用量计费的超额部分。 |
必须成立的条件
- 至少 30% 的合格滩头账户,愿意在不替换现有 CI 栈的前提下,购买一层 agent 专用 overflow 执行层。
- 前 3 个付费 pilot 能把 agent 生成任务的中位排队时间至少压低 30%,同时保持完整执行可追溯性。
- 安全和采购团队接受 BYOC、短时凭证与审计导出,认为这足以构成第三方路由的控制边界。
- 早期大多数工作负载都能靠 CPU 与浏览器导向的执行层承接,因此公司可以推迟 GPU 密集型架构,而不至于错过购买触发点。
- 至少一半付费 pilot 能转成年 ARR 超过 $80k 的合同,因为买方把产品看成控制层,而不是廉价 runner 池。
待尽调问题
- 第一批买方更想要 overflow-only 部署,还是更想顺手迁走整套 CI 与 sandbox?
- 什么证明材料最常用来撬开采购:attestation、network trace、secret access log,还是 customer-cloud 部署?
- 前 90 天的主工作负载到底是什么:集成测试、浏览器检查、生成代码执行,还是 GPU 任务?
- 在位替代方案里,最常见的是优化 GitHub Actions、采购点状 sandbox,还是内部平台团队自己做?
- 第一单预算最可能挂在开发者效率、AI 平台、云基础设施,还是安全工具?
| 结论 | Meet / investigate further |
|---|---|
| 信心 | why now 很强,企业切口也自洽,但最终把握取决于一件事:在位厂商把这层能力打包前,买方会不会先为 overflow 治理单独掏预算。 |
| 相信的理由 | AI 编码正在制造真实的执行瓶颈,而这款产品正好卡在嵌入式 CI、点状 sandbox 和多 provider 治理之间的空白处。 |
| 怀疑的理由 | 公司仍得证明,一个中立 broker 能在 GitHub、Modal 或 hyperscaler 把功能补齐之前,先赢得预算与信任。 |
| 下一步尽调 | 先用付费 BYOC pilot 验证三件事:overflow-only 部署能不能缩短排队时间、能不能过采购、以及能不能转成六位数年约。 |
财务模型
| 第 1 年收入 | $66K EBITDA $-920K · 期末现金 $2.28M |
|---|---|
| 第 2 年收入 | $865K EBITDA $-1.11M · 期末现金 $1.17M |
| 第 3 年收入 | $3.02M EBITDA $-283K · 期末现金 $883K |
| 年 ARPU | $153K |
|---|---|
| 毛利率 | 70% |
| CAC | $64K 回本期 7.2 个月 |
| LTV / CAC | 9.9x 生命周期价值 $636K |
| 轮次 | 种子轮 · $3.2M |
|---|---|
| 跑道 | 18 个月 |
| 里程碑 | 到 Q2Y2 前做到 8 个生产客户、2 份可引用的年度合同,以及可重复的 BYOC 安全审查材料,并额外保留 6 个月 buffer。 |
模型合理性
- 收入引擎. 基准情形下的收入,来自付费账户数从 Y1 结束时的 4 个增至 Q4Y3 的 30 个,同时综合年化 ARPU 随合同转化与扩张,从相当于 pilot 的 $36K 抬到 $165K。
- 必须成立的前提. BYOC 和短时凭证必须按时过安全审查,因为在所有敏感项里,销售周期对 Y3 收入和现金风险的影响最大。
- 模型失真条件. 如果采购再拖一个季度、同时毛利率卡在 65-68%,模型就会明显承压,现金低点会在下一轮融资前逼近零。
- 下一轮融资证明. 一旦公司做到大约 8-12 个生产客户,部署流程可重复、安全审查可引用,并能看到第二条工作流扩张,下一轮融资就有了充分依据。
- 营收(线/面积)
- 期末现金(虚线)
- EBITDA(柱,灰色为亏损)
- 创始人 / CEO
- 创始工程师
- 安全 / 平台工程师
- 产品 / 解决方案工程师
- GTM 负责人
- 客户成功 / 解决方案架构师
- 客户经理
- 平台 / 基础设施工程师
- 资深工程师
- 第二位 GTM / AE
| 第3年营收 | 第3年 EBITDA | 现金最低点 | 说明 | |
|---|---|---|---|---|
| 下行 | 采购流程拖慢一个季度,且早期工作负载扩张偏弱,导致公司到 Q4Y3 只能做到 22 个客户。 | |||
| 基准 | 基准情形下,公司按验证节点推进招聘,到 Q4Y2 做到 12 个客户,并在 Y3 结束时达到 30 个客户、退出 ARPU 为 $165K。 | |||
| 上行 | 如果排队时间 ROI 更强、合作方导流更顺,客户扩张会加速到 Q4Y3 的 36 个。 |
| 变量 | 下行 | 上行 | 现金影响 | 营收影响 |
|---|---|---|---|---|
| 销售周期 | 9 个月的 pilot→生产周期 | 4-5 个月的 pilot→生产周期 | ||
| CAC | $80K fully loaded CAC | $55K fully loaded CAC | ||
| 招聘节奏 | 基础设施与 GTM 招聘各提前两个季度 | 最后一位 GTM 招聘延后到 Q1Y4 | ||
| ARPU | $150K 的 Y3 退出 ARPU | $175K 的 Y3 退出 ARPU | ||
| 流失率 | 2.0% 月度 logo 流失率 | 1.0% 月度 logo 流失率 | ||
| 毛利率 | 65% 的 Y3 毛利率 | 72% 的 Y3 毛利率 |
情景
| 情景 | 第 3 年收入 | 第 3 年 EBITDA | 现金低点 | 说明 | 关键变化 |
|---|---|---|---|---|---|
| 下行 | $2.10M | $-830K | $120K | 采购流程拖慢一个季度,且早期工作负载扩张偏弱,导致公司到 Q4Y3 只能做到 22 个客户。 |
|
| 基准 | $3.02M | $-283K | $762K | 基准情形下,公司按验证节点推进招聘,到 Q4Y2 做到 12 个客户,并在 Y3 结束时达到 30 个客户、退出 ARPU 为 $165K。 |
|
| 上行 | $3.94M | $180K | $1.05M | 如果排队时间 ROI 更强、合作方导流更顺,客户扩张会加速到 Q4Y3 的 36 个。 |
|
敏感性
| 变量 | 下行情景 | 基准情景 | 上行情景 |
|---|---|---|---|
| ARPU | $150K 的 Y3 退出 ARPU | $165K 的 Y3 退出 ARPU | $175K 的 Y3 退出 ARPU |
| CAC | $80K fully loaded CAC | $64K fully loaded CAC | $55K fully loaded CAC |
| 流失率 | 2.0% 月度 logo 流失率 | 1.4% 月度 logo 流失率 | 1.0% 月度 logo 流失率 |
| 销售周期 | 9 个月的 pilot→生产周期 | 6 个月的 pilot→生产周期 | 4-5 个月的 pilot→生产周期 |
| 毛利率 | 65% 的 Y3 毛利率 | 70% 的 Y3 毛利率 | 72% 的 Y3 毛利率 |
| 招聘节奏 | 基础设施与 GTM 招聘各提前两个季度 | 把招聘与客户验证里程碑绑定 | 最后一位 GTM 招聘延后到 Q1Y4 |
关键假设 (18)
| ID | 名称 | 数值 | 单位 | 来源 |
|---|---|---|---|---|
| A1 | 模型起始月份 | 2026-06 | YYYY-MM | [BP date 2026-05-23] the model starts the 月 after the business-plan date so the seed round can fund the first hires. |
| A2 | seed 轮带来的期初现金 | 3200.0 | USDK | [BP fundingAsk.targetFundingRangeUsd $3-5M] base case uses a $3.2M seed, inside the stated range and sized to reach the first repeatable production milestone with a 6-月 buffer. |
| A3 | 模型里的客户单位 | 活跃付费企业账户 | definition | [BP investorMemo.firstCustomer.initialContract][BP market.som] customersEop counts paid pilot or production accounts; expansion is reflected through rising ARPU rather than separate seat counts. |
| A4 | 起始客户数(M1) | 0 | count | [BP milestones 0–12 个月] the company starts before any paid pilot is live. |
| A5 | 第 1 年按月新增付费客户 | [0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1] | count | [BP product.sixMonth 2-3 paid BYOC pilots][BP milestones 0–12 个月 close at least 2 paid pilots and convert at least 1 to 每年] base case lands four paying accounts across H2Y1 with one early production conversion embedded in the ARPU ramp. |
| A6 | 第 2 年季度末客户数 | [6, 8, 10, 12] | customers EoP | [BP milestones 12–24 个月 reach 8-12 production customers] base case exits Y2 at the top of the stated milestone range. |
| A7 | 第 3 年季度末客户数 | [15, 19, 24, 30] | customers EoP | [Research market.som 45 reachable year-3 customers][BP market.som $7.9M] base case ends Y3 at 30 customers, leaving room below the research SOM to stay conservative for a security-heavy enterprise sale. |
| A8 | ARPU 阶梯 | Y1 年化 ARPU:M5-M8 为 $36K,M9-M10 为 $48K,M11-M12 为 $60K;Y2 各季度分别为 $90K、$100K、$110K、$120K;Y3 各季度分别为 $135K、$145K、$155K、$165K | 每年 USDK per customer | [BP gtm.pricing paid pilot $25k-$50k and production $80k-$180k ARR][Research market.som about $176k average 每年 spend] pilots start near the midpoint and production contracts expand with usage, but the base case still exits below the research SOM ARPU. |
| A9 | 收入确认口径 | 按期间平均活跃客户数 × 年化 ARPU 计算 | formula | Startup-finance heuristic for enterprise pilots and production deployments that usually go live mid-period on average. |
| A10 | 毛利率爬坡 | Y1 付费月份为 45-55%;Y2 各季度为 60%、63%、66%、68%;Y3 各季度为 69%、70%、70%、70% | 毛利率 百分比 | [BP businessModel.targetGrossMarginPct 70][Research sensitivityCases runtime pricing compresses] early pilots carry support and provider-overhead drag before the model reaches the plan target around Y3. |
| A11 | fully loaded 薪酬区间 | 创始人 170;创始工程师 185;安全/平台 180;产品/解决方案 165;GTM 负责人 180;客户成功 140;客户经理 190;平台/基础设施工程师 175;资深工程师 175;第二位 GTM/AE 185 | 每年 USDK per FTE | [BP team roles] plus startup-finance heuristic for a U.S./Europe seed-stage infrastructure company including payroll tax and benefits load. |
| A12 | 招聘节奏 | 创始人和创始工程师在 M1 入职;安全/平台工程师在 M4;产品/解决方案工程师在 M7;GTM 负责人在 M10;客户成功在 M15;AE 在 M18;平台/基础设施工程师在 M24;资深工程师在 M28;第二位 GTM/AE 在 M32 | timing | [BP team startTiming Month 0, Month 3-6, Month 6-9, Month 9-12] plus startup-finance heuristic that later hires wait for pilot proof and production conversion rather than front-loading cost. |
| A13 | 人力成本分摊口径 | 创始人 60% 计入 S&M / 40% 计入 G&A;创始工程师 100% 计入 R&D;安全/平台 90% 计入 R&D / 10% 计入 G&A;产品/解决方案 35% 计入 S&M / 50% 计入 R&D / 15% 计入 G&A;GTM 与 AE 100% 计入 S&M;客户成功 60% 计入 S&M / 20% 计入 R&D / 20% 计入 G&A;基础设施与资深工程师 100% 计入 R&D | policy | [BP gtm][BP operations][BP team rationales] reflects founder-led sales, implementation-heavy pilots, and a product-first org through Y2. |
| A14 | 非人力经营费用爬坡 | S&M 从 Y1 上半年的 $6K/月 升到 Y3 Q4 的 $26K/月;R&D 从 Y1 上半年的 $12K/月 升到 Y3 Q4 的 $32K/月;G&A 从 Y1 上半年的 $7K/月 升到 Y3 Q4 的 $16K/月 | USDK 每月 | [BP operations][BP fundingAsk.useOfFundsSummary] plus startup-finance heuristic for cloud spend, sandbox-provider costs not in COGS, travel, legal, compliance, and enterprise onboarding tooling. |
| A15 | 稳态月流失率 | 1.4 | 百分比 | Startup-finance heuristic: 每年 infrastructure contracts with measurable queue-time ROI should retain well, but the new category and bundling risk keep churn above best-in-class infrastructure retention. |
| A16 | 每新增客户的综合 CAC | 64.13 | USDK | Calculated from modeled Y2-Y3 sales and marketing spend of $1.667M divided by 26 new customers; consistent with a technical, founder-assisted enterprise sale. |
| A17 | 融资规模规则 | 拿到下一轮可融资里程碑,并预留 6 个月 buffer | policy | [Developer instruction][BP fundingAsk.runwayMonths 18] the round is sized to reach 8 production customers, referenceable security reviews, and repeatable deployment before needing another raise. |
| A18 | 现金流简化假设 | 期末现金 = 期初现金 + 累计 EBITDA | formula | Startup-finance heuristic: the model assumes negligible capex, debt service, taxes, and working-capital distortion at this stage. |
flowchart LR Leads[Triggered platform teams] --> Pilots[Paid BYOC pilots] Pilots --> Customers[Production customers] Customers --> Revenue[Subscription plus usage revenue] Revenue --> GrossProfit[Gross profit] GrossProfit --> Cash[Cash runway]
警示项: Y1 收入只有 $65.5K,但 EBITDA burn 达 $919.5K,因此在年度生产合同开始复利前,公司必须严控纪律。 · Rule of 40 看起来异常高,主要是因为 Y3 增长是拿不到 $1M 的 Y2 基数来算,而不是成熟规模。 · 模型默认 BYOC 能过安全审查,且不用被迫改成 customer-hosted 控制平面;若这一点不成立,销售周期和服务负担都会明显变差。
主要风险
- 在位厂商打包. 云 runtime 供应商或 hyperscaler 可能补上足够多的策略与路由能力,缩小差异化空间。 缓解措施: 把重点放在中立的多 provider 治理、跨厂商审计,以及单一 provider 结构上难以提供的工作负载可移植性上。
- 采用节奏偏慢. 如果企业始终把编码 agent 关在有限 pilot 里,工作负载规模可能来不及支撑一层新的 runtime 产品。 缓解措施: 先挑已经看到 CI 饱和的客户,把定价锚在立刻可见的排队时间与容量节省上,而不是远期转型承诺。
- 安全证明负担. 买方可能不愿把不受信任代码执行和敏感 build 上下文交给一个新的中间层。 缓解措施: 从第一批共创客户开始,就提供带签名的 sandbox 模板、严格的 secret 范围控制、可回放轨迹,以及第三方安全证明。
证据
引用来源 (40)
- Modal Labs. Modal's Series C: Raising $355M at a $4.65B valuation · https://modal.com/blog/modal-series-c
- SiliconANGLE. Serverless AI infrastructure startup Modal Labs seals $355M funding round · https://siliconangle.com/2026/05/21/serverless-ai-infrastructure-startup-modal-labs-seals-355m-funding-round/
- Modal Labs. Run production Sandboxes at scale · https://modal.com/products/sandboxes
- E2B. Documentation - E2B · https://e2b.dev/docs
- E2B. Pricing — E2B · https://e2b.dev/pricing
- Daytona. Daytona - Secure Infrastructure for Running AI-Generated Code · https://www.daytona.io/
- Daytona. Daytona - Secure Infrastructure for Running AI-Generated Code · https://www.daytona.io/pricing
- Depot. Depot Pricing · https://depot.dev/pricing
- Depot. Overview of Depot GitHub Action runners · https://depot.dev/docs/github-actions/overview
- Depot. Overview of Depot CI · https://depot.dev/docs/ci/overview
- GitHub Docs. GitHub-hosted runners - GitHub Docs · https://docs.github.com/en/actions/concepts/runners/github-hosted-runners
- GitHub Docs. Self-hosted runners - GitHub Docs · https://docs.github.com/en/actions/concepts/runners/self-hosted-runners
- GitHub Docs. Actions Runner Controller - GitHub Docs · https://docs.github.com/en/actions/concepts/runners/actions-runner-controller
- GitHub Docs. Larger runners reference - GitHub Docs · https://docs.github.com/en/actions/reference/runners/larger-runners
- GitHub Docs. GitHub Actions billing - GitHub Docs · https://docs.github.com/en/billing/concepts/product-billing/github-actions
- GitHub Docs. Using artifact attestations to establish provenance for builds - GitHub Docs · https://docs.github.com/en/actions/how-tos/secure-your-work/use-artifact-attestations/use-artifact-attestations
- GitHub Docs. Control the concurrency of workflows and jobs - GitHub Docs · https://docs.github.com/en/actions/how-tos/write-workflows/choose-when-workflows-run/control-workflow-concurrency
- GitHub Docs. Configuring OpenID Connect in cloud providers - GitHub Docs · https://docs.github.com/en/actions/how-tos/secure-your-work/security-harden-deployments/oidc-in-cloud-providers
- GitHub Docs. OpenAI Codex - GitHub Docs · https://docs.github.com/en/copilot/concepts/agents/openai-codex
- AWS. Best practices working with self-hosted GitHub Action runners at scale on AWS | Amazon Web Services · https://aws.amazon.com/blogs/devops/best-practices-working-with-self-hosted-github-action-runners-at-scale-on-aws/
- AWS. Pricing · https://aws.amazon.com/codebuild/pricing/
- Google Cloud. Cloud Build pricing · https://cloud.google.com/build/pricing
- Google Cloud. Overview of Cloud Build | Google Cloud Documentation · https://docs.cloud.google.com/build/docs/overview
- Google Cloud. Safeguard builds | Software supply chain security | Google Cloud Documentation · https://docs.cloud.google.com/software-supply-chain-security/docs/safeguard-builds
- Microsoft. YAML pipeline container jobs - Azure Pipelines · https://learn.microsoft.com/en-us/azure/devops/pipelines/process/container-phases?view=azure-devops
- NIST. Secure Software Development Framework | CSRC · https://csrc.nist.gov/Projects/ssdf
- NIST. AI Risk Management Framework · https://www.nist.gov/itl/ai-risk-management-framework
- SLSA. Supply-chain Levels for Software Artifacts · https://slsa.dev/
- Firecracker. Firecracker · https://firecracker-microvm.github.io/
- gVisor. The Container Security Platform - gVisor · https://gvisor.dev/
- Anthropic. Claude Code by Anthropic | AI Coding Agent, Terminal, IDE · https://claude.com/product/claude-code
- OpenAI. Sandbox – Codex | OpenAI Developers · https://developers.openai.com/codex/concepts/sandboxing
- Stack Overflow. 2024 Developer Survey Insights for AI/ML - Stack Overflow · https://stackoverflow.blog/2024/07/22/2024-developer-survey-insights-for-ai-ml/
- Stack Overflow. Developers get by with a little help from AI: Stack Overflow Knows code assistant pulse survey results - Stack Overflow · https://stackoverflow.blog/2024/05/29/developers-get-by-with-a-little-help-from-ai-stack-overflow-knows-code-assistant-pulse-survey-results/
- IBM. Data Suggests Growth in Enterprise Adoption of AI is Due to Widespread Deployment by Early Adopters · https://newsroom.ibm.com/2024-01-10-Data-Suggests-Growth-in-Enterprise-Adoption-of-AI-is-Due-to-Widespread-Deployment-by-Early-Adopters
- Databricks. State of AI: Enterprise Adoption & Growth Trends · https://www.databricks.com/blog/state-ai-enterprise-adoption-growth-trends
- JetBrains. The State of Developer Ecosystem 2025: Coding in the Age of AI, New Productivity Metrics, and Changing Realities | The Research Blog · https://blog.jetbrains.com/research/2025/10/state-of-developer-ecosystem-2025/
- JetBrains. Which AI Coding Tools Do Developers Actually Use at Work? | The Research Blog · https://blog.jetbrains.com/research/2026/04/which-ai-coding-tools-do-developers-actually-use-at-work/
- MarketsandMarkets. DevOps Market Share, Forecast | Growth Analysis and Trends Report [2032] · https://www.marketsandmarkets.com/Market-Reports/devops-market-824.html
- MarketsandMarkets. AI Code Tools Market Size, Growth Analysis & Forecast, [Latest] · https://www.marketsandmarkets.com/Market-Reports/ai-code-tools-market-239940941.html