SERVERLESS GPU CLOUD AI 基础设施扫描 2026-05-22 to 2026-05-22 运行 20260523000114

给 AI 编码团队用的运行时 broker，把测试和生成代码放进带签名、可审计的 sandbox，在割裂的云容量之间调度。

当编码 agent 不再只是补全代码，而是开始直接写 PR，它们就必须进到真实执行环境里跑 build、集成测试、浏览器检查，以及生成代码的实际执行。多数企业现在是把自建 CI runner、单一 runtime 供应商和脆弱的安全审查硬拼在一起，结果就是队列高峰更频繁、环境不一致，也没人敢放心让不受信任的 agent 代码碰到高权限系统。最后形成的瓶颈很直接：团队不是为了少数高峰提前买一堆闲置容量，就是在 agent 真正进入生产工作流前先把采用速度压下来。

Bizidea 研究 2026-05-23

综合评分 4.2 / 5.0

4
市场
$1.1B 的 TAM、$264.6M 的滩头 SAM，加上 19.7%-24.0% CAGR，说明市场够大；但已梳理出 5 家竞品，竞争也不轻。
4
差异化
切口是一个中立、策略感知的 broker，专门在多云之间运行不受信任的 AI 代码；多数对手要么只卖单一 provider runtime，要么只卖更快的 runner。
4
执行
5 人起步的团队计划和 8-12 个客户里程碑都很清晰，同时模型给出 69.9% 毛利率、9.9x LTV/CAC 和 7.2 个月回本，但仍有 3 个模型警示。
5
时机
1 天扫描里就出现 4 个新信号，说明 AI 编码正在同时推高 sandbox 需求、加剧容量割裂，并把新资金继续推向这个赛道。

章节

为何现在

企业采用 AI 编码，已经在制造一类新的高 runtime 强度工作负载，而不只是多几次聊天调用。
买方现在开始在意 AI 生成代码能否安全执行，因此隔离 sandbox 不再是加分项，而是必备原语。
尖锐的容量短缺和 13 家合作方组成的供应链，让多 provider brokerage 的价值突然变得很实，因为对单一供应商的依赖已经开始失灵。
Modal 的估值重估说明，资本市场预期 agent runtime 这一层会长成独立大类，因此仍给聚焦型的中立 broker 留了空间。

催化因素。 正是这波把 Modal 从 $60M ARR 推到 $300M ARR、并逼着它接 13 家基础设施伙伴的企业 AI 编码浪潮，也在逼买方立刻补上“多 provider、策略安全”的执行层；否则单一供应商很快就会成为瓶颈。

章节

创意

产品夹在编码 agent 与基础设施 provider 之间，既是控制平面，也是执行层。开发者或平台团队先定义好批准过的基础镜像、secret 边界、网络策略和成本上限；随后 broker 会按延迟、合规和实时容量，把每个任务拉起到最合适的 provider 上，并放进带签名的 sandbox 里执行。它还能把 build layer 和测试产物的缓存跨 provider 复用，所以面对突发高峰时，成本和速度都比简单做云容灾更好。每次运行都会留下可回放的轨迹，说明执行了哪段代码、调用了哪些工具、暴露了哪些 secret、以及最终跑在哪个 provider 上。这让产品同时能打动两类人：一类想把 agent 扩到更多团队的平台团队，另一类是不愿盲信 agent 的安全团队。

差异化。 传统 CI 厂商管的是可信开发者工作流和固定 runner；serverless GPU 云卖的是裸执行容量。这家公司要解的是另一个控制问题：如何为不受信任的 AI 生成代码，同时做好策略执行、可复现的 sandbox 打包，以及实时容量 brokerage。时间一长，它还能沉淀出跨 provider 的可靠性与价格地图，知道什么工作负载该往哪儿路由，这层路由智能会越来越难替代。

创业论点
滩头市场	先打 500-2,000 名工程师规模的 Series C+ B2B SaaS 公司：它们已经批准后端团队使用内部编码 agent，现在需要让每个 agent 生成的 PR，都在合规网络边界内跑完集成测试、浏览器检查和临时预览环境。
切入点	做一个具备策略感知的 runtime broker：把每个 agent 任务都封进带签名的临时 sandbox，在多家已批准的云之间调度 CPU 和 GPU 步骤，并返回可审计的执行轨迹与 warm-cache 复用。
非显而易见洞察	AI 编码里真正稀缺的资产，不只是 GPU 时间，而是那些已经过策略审批、又能复现的不受信任 agent 代码执行槽位。Modal 证明了市场正在爆发，也证明 sandbox 这类安全原语很关键，因此给一个中立 runtime broker 留出了空间：它能把割裂的云容量真正变成企业可用的编码工作负载。
风险投资级路径	先从编码 agent 的 build 与测试执行切入，再往外扩成通用执行层，覆盖支持 agent、数据 agent、模型评测任务，以及需要隔离式突发算力、策略控制和审计能力的受监管内部自动化流程。

目标用户
主要用户	一家拥有 500-2,000 名工程师的 B2B 软件公司里，负责推动内部编码 agent 落地的平台主管工程副总裁或 AI 平台负责人
次要用户	负责 CI、预览环境和策略执行的资深开发者效率工程师
经济买方	平台主管工程副总裁，或由 CIO 主导的内部 AI 平台 owner

市场切入种子
首个客户	首个客户会是垂直 SaaS 公司里负责平台工程的 VP，团队规模约 700-1,500 名工程师，已经正式把 Claude Code 或类似内部编码 agent 推给后端团队，并开始看到 agent 生成的 PR 把 CI 队列打满。
购买触发点	一次内部 agent 推广从 pilot 扩到多支团队后，测试队列延迟、安全审查摩擦，或发布周的突发算力超支突然集中爆发。
当前替代方案	自建 GitHub Actions runner、单云 sandbox 供应商，以及套在现有 CI 流程外面的人工策略审查。
切换理由	这个 broker 能同时给他们爆发容量、可审计的隔离能力和 provider 冗余，而不必提前囤 GPU，也不必自己重造一套 CI 与 sandbox 栈。
定价假设	按 sandbox 分钟和缓存产物收费；对大型企业再叠加预留容量包和合规策略包。

待完成任务

任务	当前替代方案	成功指标
当编码 agent 开始跨多支团队生成 PR 时，帮平台负责人把每次 build 和集成测试都放进已批准的 sandbox 里跑完，这样他们就能在不炸掉 CI 可靠性和安全审查的前提下，把 agent 扩到更多生产工作流。	自建 runner，以及人工维护的 sandbox 环境	agent 生成任务的排队时间降低 50%，同时做到完整审计覆盖
当发布周把 agent runtime 需求推到高峰时，帮开发者效率团队把工作负载路由到多个已批准的 provider 上，这样他们就能在不囤闲置峰值容量的情况下，把延迟守在可预测范围内。	单云过度扩容，再加上人工故障切换	在目标延迟和策略合规前提下，把突发算力成本压低 30%

Agent runtime 爆发流量 broker

flowchart LR
  Buyer[VP Platform Engineering] --> Pain[Agent PRs overload CI and raise sandbox risk]
  Pain --> Product[Policy-aware burst runtime broker]
  Product --> Outcome[Faster agent rollout with auditable multi-cloud execution]

创意评分卡 — 平均4.6 / 5 · 5个维度

信号 · 5/5来自原始来源的收入和估值数据，说明这已经是一个真实且增长极快、并直接绑定企业 AI 编码的工作负载品类。
痛点 · 4/5容量瓶颈和不安全的代码执行，已经痛到足以挡住 agent 推广；只是还有部分买方会先靠现有 CI 体系硬撑。
切入点 · 5/5第一款产品定义得很窄：专做 agent 生成的 build、测试和预览任务的 sandbox 化多 provider 执行。
防御性 · 4/5跨 provider 遥测、策略集成和执行历史，会逐步叠加成持久的路由与信任优势。
规模化 · 5/5滩头市场能从编码 agent 外溢到更广泛的企业 agent runtime 与受控突发算力市场。

商业模式画布

关键伙伴

serverless runtime 供应商
云与 GPU 基础设施伙伴
编码 agent 与 CI 生态厂商

关键活动

在多家 provider 间做工作负载路由与调度
维护安全的 sandbox 模板和策略引擎
按工作负载类型衡量性能、可靠性与成本

关键资源

运行时编排控制平面
provider 集成与容量遥测
sandbox 镜像目录与执行轨迹数据

价值主张

不用自备闲置 GPU/CPU 池，也能吃下 agent 工作负载的爆发容量
每次 agent 运行都带签名、可复现，并留下审计轨迹的 sandbox
跨 provider 路由，降低供应商锁定和发布周的容量瓶颈

客户关系

以高触达方式完成上线，配套策略模板
先拿下一条工作流，再扩到更多 agent 场景
持续做优化复盘，围绕成本和排队时间节省交付价值

渠道

直接销售给平台工程负责人
与编码 agent 厂商和云市场建立合作
和 AI-native 软件公司做共创客户 pilot

客户细分

正在推内部编码 agent 的企业平台团队
负责 CI 和预览环境的开发者效率团队
审批 AI 编码执行策略的安全团队

成本结构

云与 provider 的直通成本
安全工程与合规运营
企业销售与解决方案工程

收入来源

按 sandbox 分钟收费
对预留且合规的爆发容量额外收费
年度企业合同，出售策略包与审计导出能力

章节

市场

市场规模

市场规模概览
TAM	$1.1B 估算逻辑是：全球约 10,000 家中大型软件团队 × 每队 750 名工程师 × 70% 活跃 AI 编码使用率 × 每名活跃工程师每年约 $210 的受治理 runtime 支出（约等于每周 10 个 agent 任务 × 每次 20 分钟 × 综合约 $0.02/分钟的公开 sandbox 与 runner 价格）。交叉校验后，邻近的 AI code tools 市场预计到 2028 年可达 $12.6B。
SAM	$264.6M 滩头市场测算：北美和欧洲约 2,000 家 500-2,000 人规模的 B2B 软件公司 × 900 名工程师 × 70% 活跃 AI 使用率 × 约 $210 年支出。
SOM	$7.9M 第 3 年可触达情形：45 家客户 × 900 名工程师 × 70% 活跃 AI 使用率 × 针对高合规、重突发工作负载约 $280 的年支出。

高管要点

AI 编码正在把基础设施需求从静态 CI 容量，推向可治理的执行环境——后者专门承接不受信任的 agent 生成代码。
买方缺的并不只是裸算力，而是已过策略审批的爆发容量、可溯源能力，以及跨多家 provider 的网络安全执行层。
现有厂商分散在 CI 在位者、点状 sandbox runtime 和 CI 加速层三类里，给一个中立的治理与路由 broker 留出了空白。
创业公司只有把“安全吞吐”和“多云可靠性”卖出去，而不是沦为更便宜的 runner 池，才有机会赢。

市场定义

面向 AI 编码与 agent 工作流的受治理执行基础设施：它负责把编码 agent 触发的 build、测试、浏览器检查和生成代码任务打包、调度、隔离，并拿出可证明的执行结果。

用户与买方

最核心的使用者，是负责 CI、runner 策略、网络边界和 secret 管理的平台团队或 AI 基础设施团队。经济买方通常是平台主管工程 VP 或相近的内部 AI 平台 owner；因为工作负载里包含不受信任的 agent 生成代码，所以安全与合规团队会共同审批。

购买触发点

当 agent 生成的 PR 开始与人工编写的 CI 共享同一批 runner 池时，平台团队会明显感到排队、编排和清理工作正在拖累可靠性。 [20][21][22][26][31]
一旦工作负载里包含不受信任的 agent 代码，安全审查就会陡然升级，因为 secret、出网和宿主复用都会变成采购卡点。 [25][28][39][43][48]
发布周、评测批处理和多分支 rollout 会制造爆发需求，而单一 runner 池或单一云都不适合吃这种尖峰。 [1][2][31][35]

支付意愿

直接替代方案已经把“按用量为受治理执行付费”这件事正常化了：E2B 和 Daytona 都公开了约 $0.000028/秒的 2-vCPU sandbox 定价，Depot 公布 2-vCPU GitHub Actions runner 为 $0.004/分钟，Modal 则按秒收 core 和 GiB 费用。只要 broker 能在这条基线之上，把排队、闲置峰值容量和安全审查人力明显降下来，它的付费逻辑就站得住。 [3][11][14][15]

品类动态

增长信号 19.7%-24.0% CAGR across adjacent DevOps and AI code tools markets

顺风因素

开发者对 AI 的使用已经足够广，未来会有更多软件工作先由 agent 创建、测试和审阅，而不只是由人工完成。
编码 agent 产品越来越强调自己能跑测试、执行命令和创建 PR，这意味着执行基础设施正变成产品表面的一部分。
溯源、attestation 和临时构建环境的最佳实践，正在为“受治理执行层”提供强叙事支撑。

逆风因素

信任、隐私和代码质量问题，依然会拖慢企业对 AI 编码工具的推广。
平台团队正被要求收缩工具栈，因此任何新的控制平面厂商都必须跨过更高门槛。
通用托管构建服务和托管 runner，已经足以满足大量买方的需求，因此他们完全可能推迟新采购。

验证信号

Modal 表示 sandboxes 已贡献超过三分之一收入，平台累计启动超过 10 亿个 sandbox，说明 runtime 需求不是 demo 级别，而是实打实的线上需求。
Claude Code 明确宣传自己能读代码、跑测试和开 PR，这意味着执行基础设施已成为 agent 产品表面的一部分。
Codex 也把 git、包管理器和测试 runner 等子命令放进同一层 sandbox 边界里，说明执行控制本来就是 agent 编码产品的核心组件。
JetBrains 2026 AI Pulse 显示，90% 的开发者在工作中至少使用一种 AI 工具，74% 使用专门的 AI 开发工具，未来需求底盘会继续扩大。

监管与技术约束

只要生成代码会碰到云资源或内部系统，短时凭证与最小权限访问就是入场券。
溯源与签名 attestation 正在成为构建产物和 SBOM 的默认控制面。
在多租户环境里执行不受信任代码时，共享企业环境往往需要比默认容器更强的隔离。
为了降低污染与可复现性风险，临时构建环境正越来越取代可复用宿主机。

Agent runtime 执行版图

章节

竞争

竞争大体分成三堆：Git 为中心的 CI 在位厂商、专门做 sandbox 的 runtime，以及 CI 加速厂商。真正的白地带，是一层中立治理层，能跨这些栈去做路由，而不是强迫客户整套替换。

竞争对手	阶段	切入点	定价	优势	相对劣势
GitHub Actions	incumbent	通用 CI/CD，提供 hosted、larger 和 self-hosted runner。	托管用量计费并额外收存储费；self-hosted runner 软件本身免费，但基础设施和运维都由买方承担。	工作流嵌入深、与 GitHub 原生集成，且开发者认知最强。	它仍让买方在受限 hosted 容量、付费大 runner 和自建 ARC 复杂度之间二选一；默认也不给中立的多云 brokerage。
Modal Sandboxes	scale-up	面向 agent 与强化学习工作负载的 serverless GPU 与 sandbox runtime。	按秒收 CPU 和内存费用，并提供每月免费算力额度。	在 agent 场景里可信度高，sandbox 执行规模大，AI 基础设施能力也深。	它仍是单一 provider runtime，而不是跨已批准云和既有 CI 体系的中立 broker。
E2B	scale-up	基于 Firecracker 的 AI sandbox，通过 SDK 和开源交付。	有免费层；Pro 为 $150/月加用量费，默认 2-vCPU 单价按秒公开。	接入路径快，在 agent 开发者里品牌强。	它更适合嵌一个 sandbox 进去，而不是在企业场景里编排策略、做多 provider 路由或跨云审计控制。
Daytona	scale-up	给 AI agent 提供有状态 sandbox 与 computer-use 基础设施。	按秒公开计算与内存价格，并附带较大免费额度。	启动很快，且 workspace/computer-use 故事比纯代码执行更宽。	它的重点仍是 runtime/workspace，而不是中立执行 brokerage、溯源和异构云容量优化。
Depot	scale-up	在托管基础设施上提供更快的 GitHub Actions runner、远程构建和 agent 友好的 CI。	订阅加用量计费；GitHub Actions runner 起价 $0.004/分钟，agent sandbox 另行计费。	CI 提速 ROI 清楚，从 GitHub Actions 迁过去的摩擦也低。	它优化的是自家托管 runner 栈，而不是在统一策略层下跨多家 execution provider 做套利和路由。

为什么现有厂商不会默认胜出

云构建服务. hyperscaler 的构建服务能减少 runner 运维，但它们天然绑定单一 provider；默认并不能解决跨多云的中立路由，也做不到在既有 CI 体系上统一策略。
Git 型 CI 平台. GitHub 一类的 CI 已经深度嵌进开发流程，但面对爆发式 agent 流量，团队仍得在受限的托管容量、付费大 runner 和自建 ARC 复杂度之间做取舍。
Sandbox 专业厂商. 点状 sandbox 厂商把安全执行这件事做得不错，但它们大多仍是单一 runtime，而不是能跨已批准云、企业网络和既有 CI 控制层做中立 brokerage 的平台。
CI 加速厂商. CI 加速厂商证明了买方愿意为更快执行付费，但它们优化的是自己托管的 runner 栈，而不是在异构 execution provider 之间做受策略治理的路由。

章节

商业计划

Agent Runtime Burst Broker 的第一站，不该是替代 GitHub Actions、云构建服务或某家 sandbox 厂商，而应当先做一层受策略约束的溢出执行层，卖给那些已经把内部编码 agent 推开、现在又被 agent 生成 PR 挤爆 CI 队列的 500-2,000 人 B2B 软件团队。第一款产品的边界要很清楚：只拦截 agent 触发的 build、集成测试、浏览器检查和部分生成代码任务，把它们封进带签名的临时 sandbox，再在已批准的 provider 之间路由，并留下可回放的审计轨迹。这个滩头故意做窄，因为一旦同一个平台团队已经在发布周扛排队高峰、安全审查摩擦和突发容量超支，买方、触发点和 ROI 就最清楚。按研究测算，只要公司先守在中大型软件团队，就有约 $1.1B TAM、$264.6M 初始 SAM 和 $7.9M 的第 3 年 SOM，之后还能往更广的 agent runtime 工作负载扩。GTM 也别卖“更便宜的算力”，而要卖安全吞吐和爆发可靠性：用付费 BYOC pilot 证明排队时间下降、执行轨迹完整、采购更容易过。只有当公司能成为在位厂商天然不给的那层“中立治理与路由层”，跨既有 CI 体系和多朵云同时成立，才有机会赢。最关键的反证风险也很明确：只做 overflow 也许撑不起预算；在位厂商也可能把相近的策略能力打包进去；早期买方还可能一上来就要求 GPU、浏览器或 VPC 能力，超出初始工作负载范围。因此，前 12 个月必须证明三件事：买方愿不愿为 agent 专用执行池付费，BYOC 能否明显缩短安全审查，以及跨 provider 路由在延迟、成本或审批时间上，能否真胜过单一供应商基线。

问题

随着内部编码 agent 从给建议走到直接创建 PR，agent 生成的 build、集成测试和浏览器检查开始与人工 CI 抢同一批 runner，而现有 runner 池根本不是按这种高峰设计的。
只要不受信任的 agent 代码需要接触高权限系统，安全与合规团队就不会轻易放行；他们要的是隔离、可审计，以及明确绑定网络、secret 和溯源控制的执行环境。

解决方案

在编码 agent 与执行基础设施之间插入一个具备策略感知的控制平面，让每个 agent 任务都运行在带签名的临时 sandbox 里，并强制使用批准过的基础镜像、短时凭证、明确的出网规则和可回放的执行轨迹。
把 CPU、浏览器、以及后续 GPU 工作负载路由到多家已批准的 provider，上线第一步只做 agent 专用 overflow 池，和客户现有 CI 工作流并存，而不是一上来就推翻重建。

为什么我们会赢

GitHub Actions、云构建服务和 sandbox 厂商各自都只覆盖工作流的一部分，但没有谁天然拥有跨多 provider、跨客户既有 CI 体系的中立治理、溯源和路由层。
每一次线上运行，都会继续沉淀工作负载形态、冷启动、失败模式、缓存行为和策略结果的数据；这会让路由质量和审计能力比单一 provider runtime 更快迭代。

战略选择
滩头市场	先打北美和欧洲的 B2B 软件公司：团队规模 500-2,000 人，CI 以 GitHub 为中心，后端团队已经正式启用内部编码 agent，而且 PR 与测试量已经足以把 runner 容量打满。
切入点理由	agent 专用 overflow 执行池，比整套 CI 替换更容易更快证明价值：买方已经在感受新的爆发问题，部署也能挂在现有流程旁边，安全故事在“明确不受信任的 agent 代码”这个场景下也最站得住。
推进顺序	先做 BYOC、带签名的 sandbox、审计轨迹和面向 CPU 型 build/集成测试 overflow 的策略执行，因为采购最先卡的就是这些控制点，而这条路线的供应链复杂度也低于一开始就铺开多 runtime 平台。等付费 pilot 证明“路由 + 治理”能过安全审查并转成年约后，再补浏览器自动化、有限 GPU 路由，以及更深的 provider 优化。
暂不进入	在 agent 专用切口还没反复转化之前，不做全量 CI/CD 替换 · 在编码 agent 执行还没形成标杆前，不做通用支持 agent、数据 agent 或后台自动化工作负载 · 在没有明确人工与策略审批闸门前，不做直接对生产系统的自主执行 · 在 pilot 轨迹还没证明 GPU 占比足够高前，不走 GPU-first 产品路线

进入市场
切入点	卖一层只服务 agent 的、受策略治理的 overflow 池，让平台团队可以放大编码 agent 的使用，而不用重造 CI，也不用让安全团队去盲信黑盒 sandbox 厂商。
渠道	由创始人直接销售给平台主管工程 VP、AI 平台负责人和开发者效率负责人 · 通过已采用编码 agent 的团队、平台工程圈子，以及围绕 CI 饱和事件的高参考价值 outbound，拿下共创客户 pilot · 在拿到 pilot 证明后，再做和编码 agent 厂商、云市场，以及精选安全或 DevOps 咨询公司的集成与联合销售
漏斗目标	目标账户→有效需求沟通 15-25%，有效需求沟通→付费 pilot 20-30%，付费 pilot→年度生产合同 50%+，生产客户→12 个月内扩到第二条工作流或第二支团队 40%+。
定价	先卖 8-12 周、价格约 $25k-$50k 的付费 pilot；转生产后，收年度平台承诺费，再叠加按 sandbox 分钟和缓存/存储计量的用量费。对滩头市场来说，目标 ARR 通常是 $80k-$180k，因为买方买的是受治理的吞吐、可审计性，以及避免闲置峰值容量，而不是按席位付费。

产品路线图
MVP	MVP 应支持 agent 触发的 build、集成测试和部分浏览器检查，作为一层 overflow 执行池接入既有 GitHub 为中心的工作流。首版必须包含带签名的 sandbox 模板、策略配置、短时凭证、可回放的执行轨迹，以及至少两家以 CPU 为主的已批准 provider 路由；人工编写的 CI 和大多数生产发布逻辑先不动。
6 个月	在 6 个月内交付 2-3 个付费 BYOC pilot：支持 GitHub 触发的 agent 任务拦截、带签名的 sandbox 模板、审计日志、CPU 工作负载路由，以及能证明排队时间和采购价值的缓存复用指标。
12 个月	补上浏览器自动化、VPC 和静态出网选项、常见企业控制的策略模板，以及只面向确有需求 pilot 账户的有限 GPU 路由；同时至少把 2 个 pilot 转成年约生产合同。
24 个月	把产品从 agent overflow 执行层，扩成更广的受治理 runtime 层，覆盖编码、评测和相邻内部 agent 工作负载，并继续增强路由智能、跨 provider 基准能力，以及面向受监管环境的策略包。
关键押注	只做 overflow 的部署，会比一上来迁整套 CI 更容易成交。 · BYOC 加短时凭证，足以让早期企业客户过安全审查，而不用一开始就做完全 customer-hosted 的控制平面。 · 早期需求主要集中在 CPU 与浏览器工作负载，因此 GPU 支持可以等到验证后再补，而不是一开始就决定产品。 · 跨 provider 路由和缓存复用，能在排队时间或成本上，对比单一 provider 基线做出可量化改进。

商业模式
收入来源	年度平台订阅费，覆盖策略引擎、路由控制平面、审计导出和 provider 治理 · 按 sandbox 分钟、缓存消耗和高级爆发容量收取用量费 · BYOC 部署、合规控制以及后续私有网络或受监管环境能力的高级套餐
价值单位	纳入治理的 agent 执行任务和 sandbox 分钟
目标毛利率	70%
扩张杠杆	在同一客户内部覆盖更多团队、仓库和 agent 工作流 · 为 VPC 接入、静态出网、溯源导出和受监管部署模式出售高级控制能力 · 从编码 agent overflow 扩到评测任务、浏览器密集型 QA，以及相邻的受治理内部 agent 工作负载

战略地图
北极星指标	在生产 SLA 下，运行于策略批准 sandbox 中的 agent 生成任务月执行量
输入指标	agent 生成任务的中位排队时间下降幅度 · pilot 转生产的转化率 · 拥有完整溯源与策略证据的运行占比 · 被路由工作负载的缓存命中率 · 使用超过一家已批准 provider 的生产客户占比 · 从第一条工作流扩到第二条工作流的 12 个月内转化率
待构建护城河	覆盖成本、延迟、失败率和冷启动行为的跨 provider 遥测图谱，并按工作负载类型细分 · 把策略决策、身份、provider 选择和审计结果串起来的执行轨迹数据集 · 一套可复用的企业策略模板和 onboarding 模式，让 agent 安全执行能嵌进既有 CI 体系
终止标准	如果前 10 个合格 ICP 账户里，不到 3 个愿意为 overflow-only 部署买单，就该重看切口，或者直接止损。 · 如果前 3 个付费 pilot 无法把 agent 任务中位排队时间至少降 30%，或无法证明 BYOC 与审计控制能带来采购优势，就暂停扩张。 · 如果超过一半的 pilot 工作负载都需要当前不支持、且会实质改写架构的 GPU、浏览器或网络能力，就该收窄 ICP 或重排路线图。

里程碑

0–12 个月

完成 20 次 ICP 与安全访谈，拿到 5-8 个共创客户，并把第一条工作流收窄为 agent 生成的 build、集成测试与浏览器检查 overflow。
交付一个带签名 sandbox 的 MVP，支持 BYOC 部署、策略控制、审计导出，以及至少两家已批准 provider 的路由。
拿下至少 2 个付费 pilot，并把其中至少 1 个转成年约生产合同。
建立一套成文的 provider 评分卡与工作负载分类法，用来指导 CPU、浏览器和 GPU 的路线图。

12–24 个月

在滩头市场做到 8-12 个生产客户，部署周期控制在 45 天以内，并拿下至少两次可引用的安全审查通过案例。
上线浏览器支持、在必要处提供选择性 GPU 路由，并为私有网络和高溯源要求买方交付可重复策略包。
证明既有客户会把产品扩到第二条工作流、第二支团队或更多 provider 配置。

24–36 个月

从编码 agent overflow 扩成更广的受治理 runtime 层，覆盖相邻内部 agent 工作负载。
沉淀出有防御性的路由与审计数据集，持续改善赢单率、毛利率和与 provider 的议价能力。
把公司树成企业 agent 执行的中立治理层，而不是某个点状 sandbox 或 runner 厂商。

战略地图

flowchart LR
  Wedge[Agent-only overflow wedge] --> MVP[Signed sandbox MVP]
  MVP --> Proof[Queue and audit proof]
  Proof --> Expansion[Broader governed runtime]

创始团队

角色	入职时间	理由
创始人/CEO	第 0 个月	负责共创客户销售、定价、采购推进和伙伴拓展，因为当前最核心的风险是 ICP 与预算验证。
创始工程师	第 0 个月	搭起控制平面、provider 适配层、带签名的 sandbox 模板，以及 pilot 需要的审计轨迹管线。
安全 / 平台工程师	第 3-6 个月	把 OIDC、策略控制、溯源导出和 BYOC 部署模式产品化，避免安全审查长期停留在创始人手工定制。
产品 / 解决方案工程师	第 6-9 个月	把 pilot 集成、工作负载打点和客户 onboarding 沉淀成可重复部署模板。
GTM 负责人	第 9-12 个月	等公司拿到可引用的付费 pilot 与可信转化故事后，再放大 outbound 与合作渠道。

实验路线图

阶段	实验	假设	成功指标	负责人
0–90 天	访谈 15 位目标平台负责人，以及 5 位已经在推编码 agent 公司的安全相关方。	真正打开预算的，不是团队“试过 AI 编码”，而是 agent 生成的工作负载已经带来排队和采购摩擦。	至少 10 个目标账户描述出明确触发点，且至少 5 个愿意共享 runner、队列或安全审查数据。	创始人/CEO
0–90 天	做一轮 concierge 式 pilot 模拟：把某个客户的 agent 生成任务封进带签名的 sandbox，并对比当前基线与路由后的排队时间。	只做 overflow 的部署，也能在不替换现有工作流的前提下，带来可见的吞吐提升。	至少 1 个共创客户认可这条工作流，并在模拟或受控生产流量下看到 20% 以上的排队时间改善。	创始工程师
0–90 天	向早期共创客户测试 3 套采购包，组合方式围绕 BYOC、审计导出和短时凭证。	只要产品被包装成“运行在客户云边界内的受治理执行层”，采购推进就会更快。	至少 3 个潜在客户明确指出更偏好的安全包，且没有人要求使用无人管理的长期 secret。	创始人/CEO
90–180 天	把 2-3 个共创客户转成付费 BYOC pilot，只覆盖一条线上 agent 生成工作流。	平台团队会先为一条 overflow 工作流付费，再考虑更广的 runtime 标准化。	至少签下 2 个单价 $25k+ 的付费 pilot，且至少 1 个在真实使用里把排队时间压低 30%。	创始人/CEO
90–180 天	按 CPU、浏览器、GPU、网络和驻留要求，给 pilot 账户的工作负载轨迹打点。	只要 CPU 与浏览器任务占据高价值需求的大头，初始路线图就能继续聚焦。	拿到覆盖至少 1,000 个任务的 pilot 数据集，用它判断主工作负载结构，并决定 GPU 支持是否继续后置。	产品/工程负责人
180–360 天	在至少两家已批准 provider 上线生产级路由，配好共享缓存策略和 provider 评分卡。	跨 provider 遥测和缓存摆放，足以明显提升可靠性与突发效率，从而推动转化与扩张。	至少 2 个生产客户同时使用两家 provider，并确认相较原来的单一 provider 方案，在性能、韧性或成本上有可见收益。	产品/工程负责人
180–360 天	测试 1 条集成或联合销售渠道，对象可以是编码 agent 厂商、安全咨询公司或云市场。	只要首批 pilot 已有可引用的证明，合作渠道就能带来更高意向度的 pipeline。	至少拿到 3 个通过单一合作渠道稳定导入的合格机会。	GTM 负责人

风险评估

商业计划风险 — 4 已映射

影响 →

高

R1 R4

中

低

中

高

可能性 →

R1GitHub、Modal、Depot 或 hyperscaler 可能在现有产品里打包足够多的策略与突发路由能力，把 broker 的切口压窄。 · Medium可能性 / High影响 — 聚焦中立的跨 provider 治理、与既有 CI 共存，以及单一 provider 天生难以提供的审计可移植性。
R2即便是 BYOC 模式，安全团队也可能拒绝第三方路由层，因为他们仍觉得溯源、secret 或网络控制不够。 · High可能性 / High影响 — 从第一批 pilot 起就主打 BYOC、短时凭证、明确的出网策略、可回放轨迹，以及客户指定的证明材料。
R3真实的早期工作负载，可能比预期更偏 GPU、更偏浏览器，或更受网络约束，导致计划中的 MVP 架构不够用。 · Medium可能性 / Medium影响 — 尽早给 pilot 轨迹打点，收窄 ICP，并在工作负载分类真正测出来前，不轻易做宽泛承诺。
R4平台团队也可能选择继续优化现有 GitHub 或自建 runner，而不是再买一层新的控制平面。 · Medium可能性 / High影响 — 只向已有明显排队与采购痛感的账户销售，坚持要求付费 pilot，并把 ROI 同时对比 runner 成本与安全审查人力。

风险	可能性	影响	缓解措施
GitHub、Modal、Depot 或 hyperscaler 可能在现有产品里打包足够多的策略与突发路由能力，把 broker 的切口压窄。	Medium	High	聚焦中立的跨 provider 治理、与既有 CI 共存，以及单一 provider 天生难以提供的审计可移植性。
即便是 BYOC 模式，安全团队也可能拒绝第三方路由层，因为他们仍觉得溯源、secret 或网络控制不够。	High	High	从第一批 pilot 起就主打 BYOC、短时凭证、明确的出网策略、可回放轨迹，以及客户指定的证明材料。
真实的早期工作负载，可能比预期更偏 GPU、更偏浏览器，或更受网络约束，导致计划中的 MVP 架构不够用。	Medium	Medium	尽早给 pilot 轨迹打点，收窄 ICP，并在工作负载分类真正测出来前，不轻易做宽泛承诺。
平台团队也可能选择继续优化现有 GitHub 或自建 runner，而不是再买一层新的控制平面。	Medium	High	只向已有明显排队与采购痛感的账户销售，坚持要求付费 pilot，并把 ROI 同时对比 runner 成本与安全审查人力。

首个客户
标题	一家 900 人垂直 SaaS 公司的平台主管工程 VP
画像	这是一家以 GitHub 为中心的 B2B 软件公司，已经把 Claude Code 或类似内部编码 agent 推给后端团队，现在 agent 生成的 PR 检查与集成测试正在把发布周 runner 容量压满。
触发点	一次 agent 推广从 pilot 扩到多支团队后，CI backlog、云超支，或“生成代码如何执行”的安全审查突然成为卡点。
买方	平台主管工程副总裁
初始合同	先签一笔 8-12 周、约 $25k-$50k 的付费 BYOC pilot，只覆盖一条 agent 生成工作流；等排队时间与审计目标达成后，再抵扣进 $80k-$180k 的年度生产合同，并叠加按用量计费的超额部分。

必须成立的条件

至少 30% 的合格滩头账户，愿意在不替换现有 CI 栈的前提下，购买一层 agent 专用 overflow 执行层。
前 3 个付费 pilot 能把 agent 生成任务的中位排队时间至少压低 30%，同时保持完整执行可追溯性。
安全和采购团队接受 BYOC、短时凭证与审计导出，认为这足以构成第三方路由的控制边界。
早期大多数工作负载都能靠 CPU 与浏览器导向的执行层承接，因此公司可以推迟 GPU 密集型架构，而不至于错过购买触发点。
至少一半付费 pilot 能转成年 ARR 超过 $80k 的合同，因为买方把产品看成控制层，而不是廉价 runner 池。

待尽调问题

第一批买方更想要 overflow-only 部署，还是更想顺手迁走整套 CI 与 sandbox？
什么证明材料最常用来撬开采购：attestation、network trace、secret access log，还是 customer-cloud 部署？
前 90 天的主工作负载到底是什么：集成测试、浏览器检查、生成代码执行，还是 GPU 任务？
在位替代方案里，最常见的是优化 GitHub Actions、采购点状 sandbox，还是内部平台团队自己做？
第一单预算最可能挂在开发者效率、AI 平台、云基础设施，还是安全工具？

投资人判断
结论	Meet / investigate further
信心	why now 很强，企业切口也自洽，但最终把握取决于一件事：在位厂商把这层能力打包前，买方会不会先为 overflow 治理单独掏预算。
相信的理由	AI 编码正在制造真实的执行瓶颈，而这款产品正好卡在嵌入式 CI、点状 sandbox 和多 provider 治理之间的空白处。
怀疑的理由	公司仍得证明，一个中立 broker 能在 GitHub、Modal 或 hyperscaler 把功能补齐之前，先赢得预算与信任。
下一步尽调	先用付费 BYOC pilot 验证三件事：overflow-only 部署能不能缩短排队时间、能不能过采购、以及能不能转成六位数年约。

章节

财务模型

三年合计
第 1 年收入	$66K EBITDA $-920K · 期末现金 $2.28M
第 2 年收入	$865K EBITDA $-1.11M · 期末现金 $1.17M
第 3 年收入	$3.02M EBITDA $-283K · 期末现金 $883K

单位经济
年 ARPU	$153K
毛利率	70%
CAC	$64K 回本期 7.2 个月
LTV / CAC	9.9x 生命周期价值 $636K

融资需求
轮次	种子轮 · $3.2M
跑道	18 个月
里程碑	到 Q2Y2 前做到 8 个生产客户、2 份可引用的年度合同，以及可重复的 BYOC 安全审查材料，并额外保留 6 个月 buffer。

模型合理性

收入引擎. 基准情形下的收入，来自付费账户数从 Y1 结束时的 4 个增至 Q4Y3 的 30 个，同时综合年化 ARPU 随合同转化与扩张，从相当于 pilot 的 $36K 抬到 $165K。
必须成立的前提. BYOC 和短时凭证必须按时过安全审查，因为在所有敏感项里，销售周期对 Y3 收入和现金风险的影响最大。
模型失真条件. 如果采购再拖一个季度、同时毛利率卡在 65-68%，模型就会明显承压，现金低点会在下一轮融资前逼近零。
下一轮融资证明. 一旦公司做到大约 8-12 个生产客户，部署流程可重复、安全审查可引用，并能看到第二条工作流扩张，下一轮融资就有了充分依据。

营收、现金与 EBITDA — 12 个月的 Y1 + 8 个季度的 Y2/Y3

营收（线/面积）
期末现金（虚线）
EBITDA（柱，灰色为亏损）

资金用途 — $3.2M 种子轮

按角色的人力增长 — 峰值10 FTE

创始人 / CEO
创始工程师
安全 / 平台工程师
产品 / 解决方案工程师
GTM 负责人
客户成功 / 解决方案架构师
客户经理
平台 / 基础设施工程师
资深工程师
第二位 GTM / AE

第3年情景：基准 / 下行 / 上行

	第3年营收	第3年 EBITDA	现金最低点	说明
下行	$2.10M	-$830K	$120K	采购流程拖慢一个季度，且早期工作负载扩张偏弱，导致公司到 Q4Y3 只能做到 22 个客户。
基准	$3.02M	-$283K	$762K	基准情形下，公司按验证节点推进招聘，到 Q4Y2 做到 12 个客户，并在 Y3 结束时达到 30 个客户、退出 ARPU 为 $165K。
上行	$3.94M	$180K	$1.05M	如果排队时间 ROI 更强、合作方导流更顺，客户扩张会加速到 Q4Y3 的 36 个。

敏感性——第3年现金与营收影响（按幅度排序）

变量	下行	上行	现金影响	营收影响
销售周期	9 个月的 pilot→生产周期	4-5 个月的 pilot→生产周期	-$480K	-$620K
CAC	$80K fully loaded CAC	$55K fully loaded CAC	-$410K	-$180K
招聘节奏	基础设施与 GTM 招聘各提前两个季度	最后一位 GTM 招聘延后到 Q1Y4	-$255K	$0K
ARPU	$150K 的 Y3 退出 ARPU	$175K 的 Y3 退出 ARPU	-$225K	-$302K
流失率	2.0% 月度 logo 流失率	1.0% 月度 logo 流失率	-$165K	-$230K
毛利率	65% 的 Y3 毛利率	72% 的 Y3 毛利率	-$151K	$0K

情景

情景	第 3 年收入	第 3 年 EBITDA	现金低点	说明	关键变化
下行	$2.10M	$-830K	$120K	采购流程拖慢一个季度，且早期工作负载扩张偏弱，导致公司到 Q4Y3 只能做到 22 个客户。	由于安全审查与采购各自推迟了大约一个季度，Y2 结束只有 9 个客户，Y3 结束只有 22 个，而不是 30 个。退出 ARPU 只能到 $145K，而不是 $165K，因为较少客户会扩到第二条工作流。浏览器任务与高支持负载先行进入，导致路由效率成熟前，毛利率最高只能到约 68%。
基准	$3.02M	$-283K	$762K	基准情形下，公司按验证节点推进招聘，到 Q4Y2 做到 12 个客户，并在 Y3 结束时达到 30 个客户、退出 ARPU 为 $165K。	客户数按模型中的 4 -> 12 -> 30 节奏，从 Y1 一路爬升到 Y3。随着年度合同和用量收入逐步落地，ARPU 从 pilot 水平一路抬到每客户 $165K 的退出 ARR。 Y3 毛利率到 70%，而团队到 Q4Y3 也只扩到 10 名 FTE。
上行	$3.94M	$180K	$1.05M	如果排队时间 ROI 更强、合作方导流更顺，客户扩张会加速到 Q4Y3 的 36 个。	Y2 结束做到 14 个客户，Y3 结束做到 36 个；驱动因素是付费 pilot 转化更快，且合作伙伴转介绍提高了赢单率。更多客户扩到第二条工作流并购买高级控制后，退出 ARPU 可到 $175K。毛利率能到 72%，且最后一位 GTM 招聘推迟到收入基础更清晰之后。

敏感性

变量	下行情景	基准情景	上行情景
ARPU	$150K 的 Y3 退出 ARPU	$165K 的 Y3 退出 ARPU	$175K 的 Y3 退出 ARPU
CAC	$80K fully loaded CAC	$64K fully loaded CAC	$55K fully loaded CAC
流失率	2.0% 月度 logo 流失率	1.4% 月度 logo 流失率	1.0% 月度 logo 流失率
销售周期	9 个月的 pilot→生产周期	6 个月的 pilot→生产周期	4-5 个月的 pilot→生产周期
毛利率	65% 的 Y3 毛利率	70% 的 Y3 毛利率	72% 的 Y3 毛利率
招聘节奏	基础设施与 GTM 招聘各提前两个季度	把招聘与客户验证里程碑绑定	最后一位 GTM 招聘延后到 Q1Y4

关键假设 (18)

ID	名称	数值	单位	来源
A1	模型起始月份	2026-06	YYYY-MM	[BP date 2026-05-23] the model starts the 月 after the business-plan date so the seed round can fund the first hires.
A2	seed 轮带来的期初现金	3200.0	USDK	[BP fundingAsk.targetFundingRangeUsd $3-5M] base case uses a $3.2M seed, inside the stated range and sized to reach the first repeatable production milestone with a 6-月 buffer.
A3	模型里的客户单位	活跃付费企业账户	definition	[BP investorMemo.firstCustomer.initialContract][BP market.som] customersEop counts paid pilot or production accounts; expansion is reflected through rising ARPU rather than separate seat counts.
A4	起始客户数（M1）	0	count	[BP milestones 0–12 个月] the company starts before any paid pilot is live.
A5	第 1 年按月新增付费客户	[0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1]	count	[BP product.sixMonth 2-3 paid BYOC pilots][BP milestones 0–12 个月 close at least 2 paid pilots and convert at least 1 to 每年] base case lands four paying accounts across H2Y1 with one early production conversion embedded in the ARPU ramp.
A6	第 2 年季度末客户数	[6, 8, 10, 12]	customers EoP	[BP milestones 12–24 个月 reach 8-12 production customers] base case exits Y2 at the top of the stated milestone range.
A7	第 3 年季度末客户数	[15, 19, 24, 30]	customers EoP	[Research market.som 45 reachable year-3 customers][BP market.som $7.9M] base case ends Y3 at 30 customers, leaving room below the research SOM to stay conservative for a security-heavy enterprise sale.
A8	ARPU 阶梯	Y1 年化 ARPU：M5-M8 为 $36K，M9-M10 为 $48K，M11-M12 为 $60K；Y2 各季度分别为 $90K、$100K、$110K、$120K；Y3 各季度分别为 $135K、$145K、$155K、$165K	每年 USDK per customer	[BP gtm.pricing paid pilot $25k-$50k and production $80k-$180k ARR][Research market.som about $176k average 每年 spend] pilots start near the midpoint and production contracts expand with usage, but the base case still exits below the research SOM ARPU.
A9	收入确认口径	按期间平均活跃客户数 × 年化 ARPU 计算	formula	Startup-finance heuristic for enterprise pilots and production deployments that usually go live mid-period on average.
A10	毛利率爬坡	Y1 付费月份为 45-55%；Y2 各季度为 60%、63%、66%、68%；Y3 各季度为 69%、70%、70%、70%	毛利率百分比	[BP businessModel.targetGrossMarginPct 70][Research sensitivityCases runtime pricing compresses] early pilots carry support and provider-overhead drag before the model reaches the plan target around Y3.
A11	fully loaded 薪酬区间	创始人 170；创始工程师 185；安全/平台 180；产品/解决方案 165；GTM 负责人 180；客户成功 140；客户经理 190；平台/基础设施工程师 175；资深工程师 175；第二位 GTM/AE 185	每年 USDK per FTE	[BP team roles] plus startup-finance heuristic for a U.S./Europe seed-stage infrastructure company including payroll tax and benefits load.
A12	招聘节奏	创始人和创始工程师在 M1 入职；安全/平台工程师在 M4；产品/解决方案工程师在 M7；GTM 负责人在 M10；客户成功在 M15；AE 在 M18；平台/基础设施工程师在 M24；资深工程师在 M28；第二位 GTM/AE 在 M32	timing	[BP team startTiming Month 0, Month 3-6, Month 6-9, Month 9-12] plus startup-finance heuristic that later hires wait for pilot proof and production conversion rather than front-loading cost.
A13	人力成本分摊口径	创始人 60% 计入 S&M / 40% 计入 G&A；创始工程师 100% 计入 R&D；安全/平台 90% 计入 R&D / 10% 计入 G&A；产品/解决方案 35% 计入 S&M / 50% 计入 R&D / 15% 计入 G&A；GTM 与 AE 100% 计入 S&M；客户成功 60% 计入 S&M / 20% 计入 R&D / 20% 计入 G&A；基础设施与资深工程师 100% 计入 R&D	policy	[BP gtm][BP operations][BP team rationales] reflects founder-led sales, implementation-heavy pilots, and a product-first org through Y2.
A14	非人力经营费用爬坡	S&M 从 Y1 上半年的 $6K/月升到 Y3 Q4 的 $26K/月；R&D 从 Y1 上半年的 $12K/月升到 Y3 Q4 的 $32K/月；G&A 从 Y1 上半年的 $7K/月升到 Y3 Q4 的 $16K/月	USDK 每月	[BP operations][BP fundingAsk.useOfFundsSummary] plus startup-finance heuristic for cloud spend, sandbox-provider costs not in COGS, travel, legal, compliance, and enterprise onboarding tooling.
A15	稳态月流失率	1.4	百分比	Startup-finance heuristic: 每年 infrastructure contracts with measurable queue-time ROI should retain well, but the new category and bundling risk keep churn above best-in-class infrastructure retention.
A16	每新增客户的综合 CAC	64.13	USDK	Calculated from modeled Y2-Y3 sales and marketing spend of $1.667M divided by 26 new customers; consistent with a technical, founder-assisted enterprise sale.
A17	融资规模规则	拿到下一轮可融资里程碑，并预留 6 个月 buffer	policy	[Developer instruction][BP fundingAsk.runwayMonths 18] the round is sized to reach 8 production customers, referenceable security reviews, and repeatable deployment before needing another raise.
A18	现金流简化假设	期末现金 = 期初现金 + 累计 EBITDA	formula	Startup-finance heuristic: the model assumes negligible capex, debt service, taxes, and working-capital distortion at this stage.

单位经济模型流程

flowchart LR
  Leads[Triggered platform teams] --> Pilots[Paid BYOC pilots]
  Pilots --> Customers[Production customers]
  Customers --> Revenue[Subscription plus usage revenue]
  Revenue --> GrossProfit[Gross profit]
  GrossProfit --> Cash[Cash runway]

警示项: Y1 收入只有 $65.5K，但 EBITDA burn 达 $919.5K，因此在年度生产合同开始复利前，公司必须严控纪律。 · Rule of 40 看起来异常高，主要是因为 Y3 增长是拿不到 $1M 的 Y2 基数来算，而不是成熟规模。 · 模型默认 BYOC 能过安全审查，且不用被迫改成 customer-hosted 控制平面；若这一点不成立，销售周期和服务负担都会明显变差。

章节

主要风险

在位厂商打包. 云 runtime 供应商或 hyperscaler 可能补上足够多的策略与路由能力，缩小差异化空间。 缓解措施: 把重点放在中立的多 provider 治理、跨厂商审计，以及单一 provider 结构上难以提供的工作负载可移植性上。
采用节奏偏慢. 如果企业始终把编码 agent 关在有限 pilot 里，工作负载规模可能来不及支撑一层新的 runtime 产品。 缓解措施: 先挑已经看到 CI 饱和的客户，把定价锚在立刻可见的排队时间与容量节省上，而不是远期转型承诺。
安全证明负担. 买方可能不愿把不受信任代码执行和敏感 build 上下文交给一个新的中间层。 缓解措施: 从第一批共创客户开始，就提供带签名的 sandbox 模板、严格的 secret 范围控制、可回放轨迹，以及第三方安全证明。

章节

证据

引用来源 (40)

Modal Labs. Modal's Series C: Raising $355M at a $4.65B valuation · https://modal.com/blog/modal-series-c
SiliconANGLE. Serverless AI infrastructure startup Modal Labs seals $355M funding round · https://siliconangle.com/2026/05/21/serverless-ai-infrastructure-startup-modal-labs-seals-355m-funding-round/
Modal Labs. Run production Sandboxes at scale · https://modal.com/products/sandboxes
E2B. Documentation - E2B · https://e2b.dev/docs
E2B. Pricing — E2B · https://e2b.dev/pricing
Daytona. Daytona - Secure Infrastructure for Running AI-Generated Code · https://www.daytona.io/
Daytona. Daytona - Secure Infrastructure for Running AI-Generated Code · https://www.daytona.io/pricing
Depot. Depot Pricing · https://depot.dev/pricing
Depot. Overview of Depot GitHub Action runners · https://depot.dev/docs/github-actions/overview
Depot. Overview of Depot CI · https://depot.dev/docs/ci/overview
GitHub Docs. GitHub-hosted runners - GitHub Docs · https://docs.github.com/en/actions/concepts/runners/github-hosted-runners
GitHub Docs. Self-hosted runners - GitHub Docs · https://docs.github.com/en/actions/concepts/runners/self-hosted-runners
GitHub Docs. Actions Runner Controller - GitHub Docs · https://docs.github.com/en/actions/concepts/runners/actions-runner-controller
GitHub Docs. Larger runners reference - GitHub Docs · https://docs.github.com/en/actions/reference/runners/larger-runners
GitHub Docs. GitHub Actions billing - GitHub Docs · https://docs.github.com/en/billing/concepts/product-billing/github-actions
GitHub Docs. Using artifact attestations to establish provenance for builds - GitHub Docs · https://docs.github.com/en/actions/how-tos/secure-your-work/use-artifact-attestations/use-artifact-attestations
GitHub Docs. Control the concurrency of workflows and jobs - GitHub Docs · https://docs.github.com/en/actions/how-tos/write-workflows/choose-when-workflows-run/control-workflow-concurrency
GitHub Docs. Configuring OpenID Connect in cloud providers - GitHub Docs · https://docs.github.com/en/actions/how-tos/secure-your-work/security-harden-deployments/oidc-in-cloud-providers
GitHub Docs. OpenAI Codex - GitHub Docs · https://docs.github.com/en/copilot/concepts/agents/openai-codex
AWS. Best practices working with self-hosted GitHub Action runners at scale on AWS | Amazon Web Services · https://aws.amazon.com/blogs/devops/best-practices-working-with-self-hosted-github-action-runners-at-scale-on-aws/
AWS. Pricing · https://aws.amazon.com/codebuild/pricing/
Google Cloud. Cloud Build pricing · https://cloud.google.com/build/pricing
Google Cloud. Overview of Cloud Build | Google Cloud Documentation · https://docs.cloud.google.com/build/docs/overview
Google Cloud. Safeguard builds | Software supply chain security | Google Cloud Documentation · https://docs.cloud.google.com/software-supply-chain-security/docs/safeguard-builds
Microsoft. YAML pipeline container jobs - Azure Pipelines · https://learn.microsoft.com/en-us/azure/devops/pipelines/process/container-phases?view=azure-devops
NIST. Secure Software Development Framework | CSRC · https://csrc.nist.gov/Projects/ssdf
NIST. AI Risk Management Framework · https://www.nist.gov/itl/ai-risk-management-framework
SLSA. Supply-chain Levels for Software Artifacts · https://slsa.dev/
Firecracker. Firecracker · https://firecracker-microvm.github.io/
gVisor. The Container Security Platform - gVisor · https://gvisor.dev/
Anthropic. Claude Code by Anthropic | AI Coding Agent, Terminal, IDE · https://claude.com/product/claude-code
OpenAI. Sandbox – Codex | OpenAI Developers · https://developers.openai.com/codex/concepts/sandboxing
Stack Overflow. 2024 Developer Survey Insights for AI/ML - Stack Overflow · https://stackoverflow.blog/2024/07/22/2024-developer-survey-insights-for-ai-ml/
Stack Overflow. Developers get by with a little help from AI: Stack Overflow Knows code assistant pulse survey results - Stack Overflow · https://stackoverflow.blog/2024/05/29/developers-get-by-with-a-little-help-from-ai-stack-overflow-knows-code-assistant-pulse-survey-results/
IBM. Data Suggests Growth in Enterprise Adoption of AI is Due to Widespread Deployment by Early Adopters · https://newsroom.ibm.com/2024-01-10-Data-Suggests-Growth-in-Enterprise-Adoption-of-AI-is-Due-to-Widespread-Deployment-by-Early-Adopters
Databricks. State of AI: Enterprise Adoption & Growth Trends · https://www.databricks.com/blog/state-ai-enterprise-adoption-growth-trends
JetBrains. The State of Developer Ecosystem 2025: Coding in the Age of AI, New Productivity Metrics, and Changing Realities | The Research Blog · https://blog.jetbrains.com/research/2025/10/state-of-developer-ecosystem-2025/
JetBrains. Which AI Coding Tools Do Developers Actually Use at Work? | The Research Blog · https://blog.jetbrains.com/research/2026/04/which-ai-coding-tools-do-developers-actually-use-at-work/
MarketsandMarkets. DevOps Market Share, Forecast | Growth Analysis and Trends Report [2032] · https://www.marketsandmarkets.com/Market-Reports/devops-market-824.html
MarketsandMarkets. AI Code Tools Market Size, Growth Analysis & Forecast, [Latest] · https://www.marketsandmarkets.com/Market-Reports/ai-code-tools-market-239940941.html