随着代理替代人在研究工作流里发起搜索,搜索量会按数量级上升,临时拼凑的检索逻辑很快就会被压垮。 传统搜索封装层已经不够用了,这给一层决定代理查询如何执行的策略和路由层腾出了空间。 采用已经从试验阶段跨进真实部署,买家现在要的是可靠性和治理,而不是一个能演示的 API。 Exa 这一轮融资的体量和估值说明,检索已经按核心基础设施来融资,这会让创业公司更愿意为周边工具单独买单。 催化因素。 Exa 正在成为默认搜索基础设施,采用量已超过 40 万开发者,而且市场已经明确预期:代理的搜索量会比人类高出 1,000 倍。问题已经从“代理能不能搜索”切到“生产规模下怎么治理搜索”。
产品作为 API 代理和控制台,夹在代理框架与检索供应商之间。它会预测查询意图和业务价值,再选出一条既满足时效性和置信度目标、又最省钱的路径:缓存证据包、快速头部搜索、深度长尾搜索,或浏览器执行。每次结果都会被标准化成一张来源图谱,里面有来源元数据、时效校验和可回放日志,方便团队排查错误答案,也能回应企业客户对引用的要求。客户还可以配置白名单域名、地域限制、预算上限和工作流 SLA,并看到每次代理动作的成本和失效模式。
差异化。 Exa 已经证明,面向代理的搜索需求确实存在;但这家公司赢的方式,不是再做一个重索引的一体化产品,而是做供应商无关、策略优先的控制层。它的防守力来自跨客户工作流积累下来的查询路由数据、来源策略配置和可回放日志——尤其是“什么时候不该搜、什么时候该复用旧证据”这些决策。一旦买家更看重毛利、来源可追溯性和企业控制能力,而不是单纯的搜索端点,它就会变得很黏。
创业论点 滩头市场 20-150 名工程师规模的 Series B-D 原生 AI SaaS 厂商;它们的生产代理每天要为销售情报、市场研究或合规工作流发起 50 万次以上外部 Web 搜索。 切入点 做一个检索控制平面,给每条查询分类,再把它路由到快速搜索、深度搜索、缓存或浏览器兜底,并返回可回放的引用,同时把成本和时效策略一并执行。 非显而易见洞察 下一层真正值钱的,不是再做一个搜索引擎,而是站在搜索引擎之上的控制平面:它来决定代理该不该搜、该买多深的检索、哪些来源能进系统、什么时候缓存证据已经足够。随着代理流量爆发,这些策略和路由决策,对客户的重要性会超过单纯拥有索引。 风险投资级路径 公司先从外部 Web 检索的路由与策略中间件切入,之后可以扩到检索评测、来源授权、基准数据、企业治理,以及所有依赖外部信息的代理工作流里的多供应商知识接入。
目标用户 主要用户 Series B-D 的原生 AI SaaS 公司里,负责研究、销售情报或合规代理的 ML 基础设施工程师和代理平台工程师;这些产品依赖实时 Web 检索。 次要用户 对企业级回答质量和毛利率负责、且产品会引用外部 Web 来源的 AI copilot 产品负责人。 经济买方 工程 VP 或 AI 平台负责人
市场切入种子 首个客户 第一批客户应是 50-200 人规模的原生 AI SaaS 公司中的平台工程负责人;他们已经在研究或销售情报产品里用了 Exa 或 SerpAPI,每月外部搜索支出超过 $25,000。 购买触发点 产品正式 GA 或一次大的企业级上线,会让搜索支出突然跳升,或者暴露出客户对过时、无引用、答案不一致的升级投诉。 当前替代方案 直接调用 Exa 或 SerpAPI,再叠加临时缓存、提示词启发式和内部看板。 切换理由 这个切口能在不换模型、不重写整套代理的前提下,同时压低检索支出和回答失效率,还补上企业客户本来就在要的可审计性。 定价假设 平台订阅费叠加用量计费,按托管查询量、被路由的支出和保留的证据链收费。
待完成任务 任务 当前替代方案 成功指标 当我们的代理产品开始每分钟打出上千次外部查询时,帮平台团队把检索成本和可靠性控住,这样我们才能在不出现毛利惊吓和错误引用的前提下继续放大使用量。 围绕单一搜索 API 自己手搓路由逻辑和看板 单次成功代理任务的搜索成本下降 30% 以上 当企业客户质疑一条来自 Web 的答案时,帮团队把检索链路回放并审计清楚,这样既能为输出辩护,也能快速修掉失效点。 人工翻查提示词、API 调用和应用遥测日志 在 10 分钟内把错误答案追溯到对应查询、来源和路由决策
代理搜索控制闭环 flowchart LR
Buyer[AI platform team] --> Pain[Uncontrolled search cost and weak provenance]
Pain --> Product[Retrieval control plane]
Product --> Outcome[Lower cost, cited answers, governed agent search]
创意评分卡 — 平均4.6 / 5 · 5个维度 信号 5/5 痛点 4/5 切入点 5/5 防御性 4/5 规模化 5/5 信号 · 5/5 这个聚类同时具备大额融资、估值快速抬升、具名客户采用,以及“代理搜索量会比人类高 1,000 倍”的明确判断。 痛点 · 4/5 这不是一次性危机,但只要代理产品开始放量,成本、延迟和来源可追溯失效就会直接打到毛利率和企业信任。 切入点 · 5/5 给重搜索型代理公司做检索路由和治理层,是一个边界清楚、插入点明确、ROI 可量化的首个产品。 防御性 · 4/5 工作流特定的路由数据、来源图谱和嵌入式来源策略会带来黏性,不过上游供应商长期看也可能往上走。 规模化 · 5/5 如果每个生产级代理都需要受治理的外部知识接入,这家公司就能从中间件长成整个代理经济里的标准检索控制平面。 商业模式画布 搜索 API 供应商 浏览器自动化与抓取厂商 LLM 可观测性平台 查询路由模型 检索轨迹语料库 与搜索和浏览器供应商的集成 在不牺牲回答质量的前提下降低搜索支出 为代理强制执行来源可追溯、时效性和来源策略控制 给平台团队可回放的检索链路和 SLA 可观测性 前几家共创客户采用高触达落地方式 围绕节省支出和回答质量指标做用量复盘 与平台团队共用评测看板 创始人主导销售,直接进入 AI 产品和平台团队 与代理框架和可观测性厂商合作 面向重检索 AI 构建者输出技术内容 运行依赖实时 Web 数据的生产级代理的原生 AI SaaS 公司 希望把多款应用的检索能力标准化的企业内部 AI 平台团队 云推理与存储 供应商用量成本 路由、评测与集成工程成本 年度平台订阅费 按托管搜索请求收费的用量费 用于数据保留、合规和私有化部署的企业增值模块 市场规模 TAM SAM SOM TAM · 总体可寻址市场 $0.9B SAM · 可服务市场 $180.0M SOM · 可获得市场 $5.4M 市场规模概览 TAM $0.9B 自下而上的估算:假设最终约有 15,000 个全球重检索团队会需要多供应商搜索治理(以 Exa 披露的 5,000+ 家公司采用为锚,再乘以约 3 倍来覆盖更广的多供应商采用),每个团队每年约有 $60k 的控制平面支出;交叉验证后,大致相当于 2026 年企业搜索市场的约 15%。 SAM $180.0M 把滩头约束压到约 3,000 个 Series B-D 的原生 AI SaaS 团队,它们已经有重检索生产代理;按同样每年约 $60k 的控制平面支出来算,SAM 为 $180.0M。 SOM $5.4M 第 3 年可触达份额按约 60 个客户、混合年合同价值约 $90k 建模,前提是试点先证明支出节省和引用可靠性。
高管要点 原生面向代理的检索已经明确变成基础设施:Exa 说代理的搜索量会比人类高出 1,000 倍,Tavily 也围绕同一判断完成融资,这说明这不是一个想象中的新功能,而是真实的工作负载迁移。[1] [3] 真正的切口不是再做一个索引,而是把搜索深度、抽取、浏览器兜底、缓存和可追踪性编排起来。Exa、Tavily、Cloudflare 以及浏览器运行时厂商的公开文档都说明,买家今天已经在手工把这些原语拼到一起。[48] [63] [24] [22] [23] 预算已经存在,因为供应商本来就在按查询或按运行收费:Exa、Tavily、Google Agent Search、Browserbase 和 Browserless 都公开了和用量挂钩的价格,这让搜索可靠性天然变成一条运营成本线。[45] [61] [37] [22] [23] 真正空着的位置,是供应商无关的治理层。搜索 API 只会优化自己的表面,云平台只会优化自己的平台,浏览器运行时只会优化执行;它们都不会天然去优化什么时候不该搜、什么时候该复用证据,以及怎么让跨供应商策略保持一致。[47] [39] [28] [77] 采用摩擦的核心不在 API 接入,而在企业控制。NIST、EU AI Act、Anthropic 的 computer-use 指南以及浏览器运行时安全文档都在强调:日志、监督、保留和提示词注入防护是入场门槛。[11] [12] [20] [78] 这个品类会跟着代理采用一起增长,而且增速会快过传统企业搜索:Precedence 给出的 AI agents CAGR 是到 2035 年 43.57%,而 enterprise search 是 9.05%,说明真正系在实时外部检索上的那部分支出会长得更快。[10] [9] 市场定义 面向生产级 AI 代理检索的供应商无关控制软件。这个品类位于搜索 API、Google 搜索 grounding 服务、缓存和浏览器运行时之上,用来决定一条查询该走快速搜索、深度搜索、抽取、缓存证据还是浏览器兜底,同时保留引用、时效策略和成本遥测。
用户与买方 核心使用者是运行重检索研究、销售情报或合规代理的 ML 基础设施工程师和代理平台工程师。真正拍板的通常是对毛利率、回答质量和企业信任负责的工程 VP、AI 平台负责人或平台 GM。
购买触发点 产品正式 GA 或一次企业级上线,会把外部搜索支出瞬间拉高,也暴露出直接调供应商接口缺少成本护栏。 [45] [61] [37] 过时或错误引用引发客户升级投诉后,买家会立刻发现,可回放能力和来源策略控制比“搜得更广”更急。 [15] [16] [51] 团队为了救回失败的搜索,会叠加浏览器执行或多供应商兜底;运维复杂度随之上升,也给路由控制平面留下了明确插入点。 [28] [22] [23] 支付意愿 公开定价已经在训练买家把检索当成按量计费的生产支出:Exa 按每 1,000 次搜索请求收 $7,Tavily 按 credit 收费,Google Agent Search 按每 1,000 次查询收费,浏览器运行时则按搜索、抓取、浏览器小时或单位计费。因此控制平面可以把 ROI 锚定在“少花了多少路由支出”和“少失败了多少任务”上,而不必去创造一个全新的预算类别。 [45] [61] [37] [22] [23]
品类动态 增长信号 43.57% CAGR
顺风因素 AI agent 市场的增速明显快于传统企业搜索,这会在实时外部检索上方叠出一层更快增长的需求。 供应商现在已经把搜索、抽取、研究和浏览器原语做成可组合 API,控制平面层的集成摩擦因此下降。 Exa 和 Tavily 的融资说明,投资人和客户都把 agent 检索看成战略基础设施。 逆风因素 如果搜索厂商或云平台把治理能力自己补齐,独立编排层的价值会被压缩。 浏览器兜底在运维上依旧混乱,还会引入提示词注入、数据保留和安全评审负担,从而拉长销售周期。 验证信号 Exa 的融资和采用叙事说明,大型 AI 构建者已经把 Web 搜索当成核心基础设施。 Tavily 的融资和 LangChain 集成说明,agent 开发者会主动选择专用搜索 API,而不是默认回到通用 Web 搜索。 Exa、Google 和浏览器运行时的公开按查询定价,让“以成本优化为切口”变得足够具体。 越来越多的独立对比把供应商选择、延迟和响应结构当成 agent 团队的一等工程决策。 监管与技术约束 EU AI Act 提高了高风险部署对文档、日志、可追溯性和人工监督的要求。 NIST 用结构化风险管理来定义可信 AI 部署,这反而强化了“可审计检索策略”这件事的价值。 Anthropic 明确提醒,能操纵浏览器的代理会遭遇提示词注入,因此需要域名限制、最小权限和高影响动作的人类确认。 Google 文档写明 grounding with Google Search 每天有 100 万次查询上限,这凸显了上游供应商限制,也说明路由与兜底控制有必要。 如果工作流里包含浏览器兜底,企业买家一定会追问日志、录屏和存储产物的保留与安全控制。 代理检索栈市场地图 ← Single-provider primitive Cross-provider orchestration → ← Lower workflow urgency Higher production urgency → Q2 Q1 · 优势区 Q3 Q4 Proposed startup Exa Tavily Google Agent Search Browserbase 竞争来自四个方向:Exa、Tavily 这样的原生面向代理搜索 API;Google 领头的云 grounding 和企业搜索栈;Browserbase、Browserless 这样掌握执行兜底的浏览器运行时;以及平台团队自己写的胶水代码。创业公司只有在自己成为跨供应商的策略与支出层时才有机会,而不是沦为某一栈里的一块点状能力。
竞争对手 阶段 切入点 定价 优势 相对劣势 Exa 成长期 面向代理的原生搜索引擎,支持可配置延迟、深度搜索、内容抽取和异步 agent 工作流。 $7/1k 搜索请求;deep search $12;deep-reasoning $15;每次 agent run 为 $0.025-$2.00。 语义检索强、搜索模式广,而且已经有公开证据表明头部 AI 公司在生产里使用。 它优化的仍是 Exa 自己这套栈,而不是跨多家供应商的中立路由、支出策略或证据复用。 Tavily 成长期 面向 LLM 的搜索、抽取、抓取、映射和研究端点,围绕 agent 工作流做了轻量集成。 每月 1,000 个免费 API credits;按量为每 credit $0.008;企业版定制。 开发者友好,围绕 agent 检索有清晰产品形态,也已经被大量框架采用。 和 Exa 一样,Tavily 本质上仍是单一供应商表层,而不是在多家供应商和多条兜底路径之间做仲裁的控制平面。 Google Agent Search 在位者 Google Cloud 栈内的企业搜索和 grounded answers,能直接利用 Google Search 做 grounding,并支持可配置搜索应用。 $1.50/1,000 standard queries;$4.00/1,000 enterprise queries;高级生成式答案查询另加 $4.00/1,000。 分发能力强、企业打包能力强,又能直接拿到 Google 搜索 grounding,因此对大公司买家很有说服力。 它更适合 Google 原生部署和内部搜索场景,不适合做跨多家外部检索供应商的中立路由层。 Browserbase 成长期 浏览器 agent 基础设施,提供搜索、fetch、浏览器小时、验证码处理,以及用于浏览器兜底的企业安全控制。 开发者和 startup 套餐按浏览器小时计费,另加 $7/1k 搜索调用和 $0.5-$1/1k fetch 调用;企业版定制。 当普通搜索失败时,它掌握着搜索供应商通常要交出去的带认证浏览器执行层。 它是执行和抓取运行时,不是决定何时搜索、何时缓存、何时浏览的检索路由层。
为什么现有厂商不会默认胜出 搜索 API 厂商. Exa 和 Tavily 已经把搜索质量、抽取和研究深度做得很强,但它们本质上仍是单一供应商产品,默认不会替客户把多供应商路由、证据复用和中立的支出治理做到极致。 云平台. Google 把 grounding、enterprise search 和治理功能打包在一起,但它的经济和技术重心仍然是 Google 栈本身,而不是横跨多家检索供应商和浏览器兜底的中立控制平面。 浏览器运行时. Browserbase 和 Browserless 在带认证的兜底和抽取上很有吸引力,但它们卖的是执行原语,而不是查询分类、证据准入或供应商无关的搜索治理。 网关与可观测性厂商. Cloudflare 证明团队确实需要分析、兜底、自定义成本记账和密钥管理,但它的范围仍是模型网关基础设施,而不是跨搜索、缓存和浏览器动作的检索编排层。 自研方案. 工具调用框架和供应商 SDK 让自研编排成为可能,但这会把路由策略、失效处理和可审计性工作重新压回平台团队自己身上。 这家公司应该先做成一个供应商无关的检索控制平面,服务那些已经在真实 Web 数据上跑生产级代理、同时被搜索成本、回答质量和来源可追溯性卡住的原生 AI SaaS 团队。第一批客户应是 Series B-D 的原生 AI SaaS 公司:20-150 名工程师,至少有一个重检索的研究、销售情报或合规工作流,并且每月在 Exa、Tavily、Google 或浏览器兜底上合计花掉超过 $25,000 的外部搜索费用。首版产品应以 API 代理和策略层的形态压在这些供应商之上,决定什么时候走快速搜索、深度搜索、缓存证据或浏览器兜底,并把可回放引用和成本遥测一并返回。这个切口成立,是因为买家已经把检索看成按量计费的基础设施开支,所以试点可以围绕“每次成功代理任务能省多少钱”和“多快能排查过时或无引用答案”来卖。研究支撑了一个足够大的市场:估算 TAM 为 $0.9B、滩头 SAM 为 $180.0M;如果公司能拿下约 60 个客户、混合 ACV 约 $90k,第 3 年可触达的 SOM 大约是 $5.4M。刻意不做的,是再造一个搜索引擎、做一套泛企业搜索平台,或上来就做完整的自治浏览器栈。公司应先拿下一处控制点,让多供应商路由和治理的价值先超过“自己拥有索引”这件事。最主要的反证风险有两个:一是供应商把原生治理能力打包到足以压平这个切口,二是有足够路由查询支出的团队其实没那么多,不足以支撑一个独立预算科目。所以前 12 个月要盯住 3-5 家付费共创客户,证明覆盖工作流的检索支出至少能下降 25%,同时证明浏览器兜底只是少数例外,而不是吞掉毛利的默认路径。
问题 重检索代理产品一旦从试点走向生产,就会同时积累失控的搜索支出、过时或薄弱的引用,以及不一致的失效处理。 平台团队可以买搜索 API 和浏览器运行时,但它们依旧缺一层中立控制层,来跨供应商做路由、缓存、来源追溯、预算上限和来源策略执行。 解决方案 提供一个 API 代理和看板,给每条查询分类,再按时效性、置信度和成本策略,把它路由到缓存证据、快速搜索、深度搜索或受限的浏览器兜底。 把每一步检索都标准化成可回放的证据链,附带来源元数据、策略日志和单任务成本分析,方便团队排查错误答案,也能满足企业对引用的要求。 为什么我们会赢 这个产品比“再做一个搜索引擎”更聚焦,也比任何单一供应商栈都更中立,所以对已经同时管理多个检索供应商的买家来说,ROI 更容易讲清楚。 防守力会随着每个被覆盖工作流的路由表现数据、证据复用模式和嵌入式来源策略配置不断累积。 第一单可以绑在一个已经很痛的工作流和一张看得见的供应商账单上,比去推整套企业搜索替换要更快证明。 战略选择 滩头市场 滩头市场是 Series B-D 的原生 AI SaaS 公司:20-150 名工程师,至少有一个生产级研究、销售情报或合规代理,并且每天通过 Exa、Tavily、Google 或类似供应商发起至少 50 万次外部 Web 搜索。 切入点理由 窄切口应该是一条在线工作流的检索治理试点:平台团队已经能看到预算飙升和引用失效。先在这里证明,远比一上来对所有企业应用团队卖横向搜索治理要快。 推进顺序 先用一层轻代理、供应商分析、可回放引用和策略控制去包住现有搜索栈,让部署摩擦低、节省效果可量化。等试点证明客户信任这套路由层,也愿意把它当基础设施而不是定制服务来付费,再加更深的缓存、评测、浏览器兜底编排和伙伴驱动分发。 暂不进入 自建专有 Web 索引或抓取网络 · 卖给还没到预算痛点的低查询量团队 · 面向 HR、客服和知识管理的广义企业内部搜索 · 在没有审批闸门的情况下,为敏感工作流提供全自治浏览器执行
进入市场 切入点 先卖一个面向单条生产工作流的付费检索治理试点;等客户信任路由规则并看到单次成功代理任务的成本下降后,再把试点转成常开的控制平面。 渠道 创始人主导外呼,直接找已经在用 Exa、Tavily、Google Agent Search 或浏览器兜底的团队 · 与搜索供应商、浏览器运行时厂商和 AI 可观测性平台联合销售或做集成合作 · 面向在构建重检索代理的平台工程师输出技术内容和基准报告 漏斗目标 线索→合格试点 15-25%;合格试点→付费试点 40-50%;付费试点→生产合同 50%+;生产合同→第 2 条工作流扩展在第 1 年达到 30%+。 定价 应收年度平台订阅费,再叠加按托管查询量和保留证据链计费的用量费,因为买家已经习惯把检索看成按量计费的基础设施支出。第一批付费试点可以卖成一个范围明确的节省与治理项目;如果控制平面确实降低了支出、提升了引用回放效率,再转成单个生产工作流约 $60k-$120k 的年 ACV。
产品路线图 MVP MVP 应该是一层供应商无关的代理,先接 Exa、Tavily、Google 搜索 grounding 和一家浏览器兜底伙伴;能力包括查询分类、成本记账、缓存控制、白名单域名策略和可回放证据链。它必须能说明每个任务走了哪条路径、为什么这么选,以及是否满足了时效性和引用策略。 6 个月 6 个月内要把生产试点跑起来:按查询类型设置路由策略,支持共享缓存和证据复用,补齐供应商级可观测性,并对少量单靠搜索无法解决的查询提供受限浏览器兜底。 12 个月 12 个月内补上客户定制评测框架、适用于受监管和面向客户工作流的策略模板、风险兜底动作的审批闸门,以及超出初始 Exa-Tavily-Google 组合的更多供应商支持。 24 个月 24 个月内,从单一工作流切口扩成更广义的外部知识控制平面:支持多团队治理、基准数据、企业级保留控制,以及检索评测和授权来源编排等相邻产品。 关键押注 大多数目标买家在要求专有搜索质量提升前,先能从更好的路由和证据复用里拿到可观节省。 · 浏览器兜底出现得足够频繁,战略上值得做;但又不会频繁到把首个切口的毛利率打穿。 · 可回放证据链和域名策略,对企业来说足够有辨识度,能赢过自己手搓的编排。 · 轻代理式集成比重写整套代理栈更容易被早期客户接受。
商业模式 收入来源 检索控制平面的年度订阅费 · 按托管查询量、证据保留和高级策略控制收取的超额用量费 · 私有化部署、保留控制、审计打包和高级评测模块等企业增值项 价值单位 被覆盖的生产工作流,内含一定路由查询量和证据保留额度 目标毛利率 72% 扩张杠杆 首个试点转生产后,在同一客户内再覆盖更多重检索工作流 · 把供应商覆盖面和策略深度扩展到搜索、缓存和浏览器兜底路径 · 向更大的企业部署销售更高保障等级的治理、评测和保留模块
战略地图 北极星指标 在目标检索成本之下,同时满足时效性和引用策略的被覆盖代理任务占比 输入指标 付费试点转生产的转化率 · 覆盖工作流上每次成功代理任务节省的检索支出 · 回放一条错误答案背后检索链路的中位耗时 · 重复高价值查询的缓存命中率 · 需要浏览器兜底的路由查询占比 待构建护城河 按查询类别沉淀历史路由图谱,知道哪家供应商、哪种深度、哪条兜底路径效果最好 · 与客户结果和失效模式绑定的可回放证据链语料库 · 嵌入客户工作流后会变得很黏的域名、地域和保留策略 终止标准 与 30 个合格平台团队沟通后,付费共创客户仍少于 3 家 · 前 3 个试点里,覆盖工作流的支出节省低于 15% · 前 5 个试点后,付费试点转生产的转化率低于 40% · 超过 30% 的覆盖查询都必须走浏览器兜底,且没有清晰的毛利补偿
里程碑 0–12 个月 在原生 AI SaaS 滩头市场签下 3-5 家付费共创客户 在前 3 个试点里,至少一条覆盖工作流实现 25% 的检索支出下降 上线具备可回放证据链和白名单域名策略的生产可用代理层 至少把 2 个付费试点转成年度生产合同 12–24 个月 从首条工作流扩到每个客户群至少另外 2 条重检索工作流 补齐更广的供应商支持、评测工具和更高保障等级的治理模块 建立 3 个能带来或加速试点的活跃生态伙伴 在不把部署做成重服务的前提下,把可重复 ACV 跑进模型中的 $60k-$120k 区间 24–36 个月 把自己标准化成多团队代理部署里的外部知识控制平面 推出企业级保留和区域策略打包,支撑更广的国际销售 把路由与证据数据集做大到足以支撑基准产品和扩展模块 沿着模型路径,把年化收入推进到约 $5.4M 的第 3 年 SOM 战略地图 flowchart LR
Wedge[Retrieval-governance pilot] --> MVP[Provider-agnostic routing proxy]
MVP --> Proof[Lower spend and replayable citations]
Proof --> Expansion[More workflows and enterprise governance modules]
创始团队 角色 入职时间 理由 创始人/CEO Month 0 早期必须由创始人亲自打单,因为买家职级高、品类需要教育,而且早期定价取决于能否量化 ROI。 创始工程师 Month 0 公司需要一个足够强的技术负责人,来把代理层、路由逻辑、遥测和早期集成先搭起来。 应用 ML 与产品工程师 Month 2 查询分类、缓存策略和检索评测是核心产品风险,必须尽早有人专门负责。 解决方案工程师 Month 6 早期企业试点成败,取决于能否快速接入、梳理工作流,并从客户轨迹里证明价值。 安全与平台工程师 Month 9 一旦试点进入采购,保留控制、策略日志和部署加固都会变成关键。 GTM 负责人 Month 12 只有在试点打包方案和转化证据清楚后,才值得引入可重复的商机管道负责人。
实验路线图 阶段 实验 假设 成功指标 负责人 0–90 天 ICP 与预算阈值发现 那些账单可见、且回答面向客户的原生 AI SaaS 重检索团队,会把这个问题描述成一个有预算的平台痛点,而不是“有更好,没有也行”的优化项。 完成 15 次探索访谈,其中 8 家符合滩头画像,5 家愿意分享可信的支出或失败基线。 创始人/CEO 0–90 天 礼宾式路由对比测试 在缓存、快速搜索、深度搜索和浏览器兜底之间手动调路由,至少能把某条工作流的单次成功任务成本压低 25%。 2 家共创客户各完成至少 100 个任务的对比测试,且两家都在不降低回答接受率的前提下实现 25% 以上支出下降。 创始工程师 90–180 天 轻代理试点部署 相比彻底替换检索栈,客户会更快接受一层供应商无关的轻代理。 上线 3 个付费试点,且从部署到第一条生产级路由任务的时间低于 30 天。 创始工程师 90–180 天 定价与打包测试 平台订阅费加托管查询超额收费,会比纯消耗式定价更容易成交。 在 6 次预算负责人沟通里,首选方案至少赢下 4 次,并进入 2 份已签试点 scope。 创始人/CEO 6–12 个月 证据链采购验证 审计日志、白名单域名策略和保留控制,足以帮面向客户的 AI 场景过安全评审。 至少 2 个试点完成安全评审,且不要求客户自托管或额外开发一次性控制项。 安全与平台负责人 12–18 个月 伙伴驱动扩张验证 搜索供应商、浏览器运行时和可观测性伙伴,能带来与创始人外呼相当的高质量试点。 25% 的合格商机管道来自 3 个活跃伙伴,且试点转化率不低于直销。 GTM 负责人
风险评估 商业计划风险 — 4 已映射 可能性 →
R1 供应商把路由、缓存或治理能力快速打包,压缩独立切口。 · High可能性 / High影响 — 把差异化放在多供应商中立、工作流级策略控制,以及跨后端的证据复用上,而不是绑定单一供应商的功能。 R2 真正有足够路由查询支出、能接受新增基础设施供应商的目标团队太少。 · Medium可能性 / High影响 — 只聚焦已经在检索上有显著支出的账户;试点前先拿到可量化支出基线,避免低查询量客群。 R3 浏览器兜底的使用频率高于预期,拖累毛利率,也让部署更复杂。 · Medium可能性 / High影响 — 浏览器执行优先走合作伙伴,单独计费兜底路径,并在扩展浏览器重场景前先把路由和缓存做到位。 R4 日志、产物和兜底路径让客户觉得风险高,导致安全与合规评审拖慢成交。 · Medium可能性 / Medium影响 — 在 MVP 里就把保留控制、域名限制、审批闸门和可审计路由日志做进去,而不是拖到后面的企业版。 风险 可能性 影响 缓解措施 供应商把路由、缓存或治理能力快速打包,压缩独立切口。 High High 把差异化放在多供应商中立、工作流级策略控制,以及跨后端的证据复用上,而不是绑定单一供应商的功能。 真正有足够路由查询支出、能接受新增基础设施供应商的目标团队太少。 Medium High 只聚焦已经在检索上有显著支出的账户;试点前先拿到可量化支出基线,避免低查询量客群。 浏览器兜底的使用频率高于预期,拖累毛利率,也让部署更复杂。 Medium High 浏览器执行优先走合作伙伴,单独计费兜底路径,并在扩展浏览器重场景前先把路由和缓存做到位。 日志、产物和兜底路径让客户觉得风险高,导致安全与合规评审拖慢成交。 Medium Medium 在 MVP 里就把保留控制、域名限制、审批闸门和可审计路由日志做进去,而不是拖到后面的企业版。
首个客户 标题 原生 AI SaaS 公司的 AI 平台负责人 画像 一家 Series B-D 软件公司,员工 50-200 人、工程师 20-150 人,已有一条生产级研究、销售情报或合规代理,并且已经在用一家或多家外部搜索供应商。 触发点 产品正式 GA、企业级上线,或一次客户升级投诉,会把检索账单和过时/弱引用答案的问题直接暴露出来。 买方 工程 VP 或 AI 平台负责人 初始合同 首份合同可做成单条工作流的 $20k-$40k 付费试点和基线测量;等路由策略和证据链在生产里跑通并建立信任,再转成约 $60k-$120k 的年 ACV。
必须成立的条件 目标买家里,至少有相当一部分已经在外部检索上花到足以支撑一个独立控制平面预算科目。 轻代理层能在不牺牲回答接受率和时效性的前提下,把覆盖工作流的检索支出至少压低 25%。 买家足够看重可回放引用和策略控制,愿意选择一层中立平台,而不是继续深度绑定单一供应商。 首个切口里,浏览器兜底只占少数路由查询,因此毛利率还能维持在软件基础设施应有的区间。 供应商和框架的变化,不会逼出过多集成工作,导致业务最后变成服务外包。 待尽调问题 每月多少路由查询支出或多高的失败率,才足以让客户给一层专用控制平面批预算? 在前十个真实线索里,哪个 KPI 最能打动买家:节省支出、引用回放速度,还是错误答案更少? 在优化查询路由和缓存后,目标团队到底还有多高比例必须走浏览器兜底? 滩头客户最常见的是哪几种供应商组合,因此 MVP 应先集成哪些栈? Exa、Tavily、Google 和各类 gateway 厂商,已经在同一工作流里下放了哪些原生治理功能? 投资人判断 结论 见面 / 继续尽调 信心 切口和时点都很强,但最终判断取决于两件事:能否证明独立预算阈值真实存在,以及能否让重浏览器工作负载不把毛利率拖垮。 相信的理由 计划瞄准的是一个真实的生产瓶颈:买家已经看得到按量计费的检索成本,却没有一层跨供应商、且中立的治理层。 怀疑的理由 搜索供应商、云厂商和浏览器厂商都可能把相邻控制能力一起打包,所以创业公司必须先证明:中立性和工作流数据,确实能在现有厂商补齐缺口前创造足够价值。 下一步尽调 确认 3 个付费试点,客户本来就在外部检索上有真实支出;同时证明某一条工作流能把支出压低至少 25%,且引用回放时间低于 10 分钟。
三年合计 第 1 年收入 $54K EBITDA $-928K · 期末现金 $2.37M 第 2 年收入 $520K EBITDA $-1.28M · 期末现金 $1.10M 第 3 年收入 $1.81M EBITDA $-733K · 期末现金 $363K
单位经济 年 ARPU $110K 毛利率 72% CAC $76K 回本期 11.6 个月 LTV / CAC 6.9x 生命周期价值 $528K
融资需求 轮次 种子前轮 · $3.3M 跑道 36 个月 里程碑 在 Q2Y3 前做到 16 个付费客户,证明混合生产 ACV 超过 $100K、毛利率达到 72%,并拥有 3 个活跃生态伙伴,同时到 Q4Y3 仍保留约 6 个月缓冲。
模型合理性 收入引擎. 基准情形的收入来自这样一条路径:Y1 有 4 个付费账户,到 Q4Y3 增长到 24 个,同时混合 ACV 从 $36K 的试点定价抬升到 $110K 的生产合同。必须跑通的环节. 在 GTM 团队扩张前,创始人主导的试点必须先转成生产合同,因为销售周期敏感性是影响收入和跑道的最大单一变量。模型失效条件. 如果买家不愿支持每年 $60K-$120K 的控制平面预算,或者浏览器兜底把毛利率长期压在约 68% 以下,downside 情形就会把现金打成负数。下一轮融资证明点. 下一轮最强的融资故事是:Q2Y3 前做到 16 个付费客户、72% 毛利率和 3 个活跃生态伙伴,证明增长不再只靠创始人亲自带单。 营收、现金与 EBITDA — 12 个月的 Y1 + 8 个季度的 Y2/Y3 $0K $1.00M $2.00M $3.00M $4.00M M1 M4 M7 M10 Q1Y2 Q4Y2 Q3Y3 Q4Y3 营收(线/面积) 期末现金(虚线) EBITDA(柱,灰色为亏损)资金用途 — $3.3M 种子前轮 工程 · 45%
GTM · 28%
G&A · 9%
缓冲(6 个月) · 18%
按角色的人力增长 — 峰值9 FTE
Q1Y1 3 Q2Y1 4 Q3Y1 5 Q4Y1 6 Q1Y2 6 Q2Y2 6 Q3Y2 6 Q4Y2 8 Q1Y3 8 Q2Y3 8 Q3Y3 8 Q4Y3 9 创始人 / CEO 创始工程师 应用 ML / 产品工程师 解决方案工程师 安全 / 平台工程师 GTM 负责人 客户成功 / 解决方案架构师 客户经理 平台工程师第3年情景:基准 / 下行 / 上行 第3年营收 第3年 EBITDA 现金最低点 说明 下行 $1.25M -$1.19M -$156K 试点转正更慢,且独立预算的成立证据更弱,导致公司跑不到计划中的生产客户爬坡。 基准 $1.81M -$733K $363K Y1 的 4 个付费试点转成一条节奏克制但可重复的生产增长曲线,收入同时受益于 ACV 抬升和客户数温和扩张。 上行 $2.46M -$220K $879K 共创客户转化更快,伙伴渠道更早贡献线索,且生产定价因为更强的用量与治理附加率而继续上探。
敏感性——第3年现金与营收影响(按幅度排序) 变量 下行 上行 现金影响 营收影响 CAC 每个新客户的 CAC 为 $95K 每个新客户的 CAC 为 $65K -$375K $0K 销售周期 试点转生产的签约延后一整个季度 伙伴带来的交易在试点证明后 2 个月内成交 -$290K -$385K 招聘节奏 把平台工程师和第二个前线岗位都提前两个季度招聘 将 Y3 的平台岗位延后一个季度,并用伙伴覆盖溢出需求 -$140K -$60K ARPU Y3 混合年 ACV 为 $100K Y3 混合年 ACV 为 $120K -$118K -$165K 流失率 首个合同期结束后月流失率为 2.0% 月流失率为 1.0% -$90K -$120K 毛利率 68% 74% -$73K $0K
情景 情景 第 3 年收入 第 3 年 EBITDA 现金低点 说明 关键变化 下行 $1.25M $-1.19M $-156K 试点转正更慢,且独立预算的成立证据更弱,导致公司跑不到计划中的生产客户爬坡。 Y2 末只有 8 个付费客户,Y3 末只有 18 个,而不是 24 个 混合年 ACV 在 Y2 只能到 $75K,Y3 只能到 $100K 由于浏览器兜底和供应商成本居高不下,毛利率最高只能到约 68% 基准 $1.81M $-733K $363K Y1 的 4 个付费试点转成一条节奏克制但可重复的生产增长曲线,收入同时受益于 ACV 抬升和客户数温和扩张。 Y2 末达到 10 个付费客户,Y3 末达到 24 个 混合年 ACV 从 $36K 的试点定价抬升到 Y2 的 $80K 和 Y3 的 $110K 随着路由和缓存成熟,毛利率达到 business-plan 设定的 72% 目标 上行 $2.46M $-220K $879K 共创客户转化更快,伙伴渠道更早贡献线索,且生产定价因为更强的用量与治理附加率而继续上探。 Y2 末达到 12 个付费客户,Y3 末达到 30 个 混合年 ACV 在 Y2 达到 $85K,Y3 达到 $120K 随着缓存命中率和查询路由优于计划,毛利率提升到 74%
敏感性 变量 下行情景 基准情景 上行情景 ARPU Y3 混合年 ACV 为 $100K Y3 混合年 ACV 为 $110K Y3 混合年 ACV 为 $120K CAC 每个新客户的 CAC 为 $95K 每个新客户的 CAC 为 $76.32K 每个新客户的 CAC 为 $65K 流失率 首个合同期结束后月流失率为 2.0% 月流失率为 1.25% 月流失率为 1.0% 销售周期 试点转生产的签约延后一整个季度 付费试点在两个季度内转成生产合同 伙伴带来的交易在试点证明后 2 个月内成交 毛利率 68% 72% 74% 招聘节奏 把平台工程师和第二个前线岗位都提前两个季度招聘 Y3 只在拿到 Y2 生产验证后新增 1 名平台工程师 将 Y3 的平台岗位延后一个季度,并用伙伴覆盖溢出需求
关键假设 (18) ID 名称 数值 单位 来源 A1 模型起始月份 2026-06 YYYY-MM [BP date 2026-05-21] 模型从 business-plan 日期后的第一个月启动,这样融资会先在招聘爬坡前完成。 A2 期初现金 3300.0 USDK [BP fundingAsk targetFundingRangeUsd $2-4M] 基准情形采用 $3.3M 的 pre-seed,位于给定区间内,也足以跑到下一轮里程碑并保留 6 个月缓冲。 A3 模型中的客户单位 活跃付费客户账户 definition [BP market.som 60 customers at about $90k blended ACV; BP businessModel.unitOfValue covered production workflow] customersEop 跟踪的是付费账户数,扩张则通过 ARPU 上升体现。 A4 起始客户数(M1) 0 count [BP milestones 0-12 个月] 公司在签下付费共创客户前处于 pre-revenue 状态。 A5 Y1 每月新增付费客户 [0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0] count [BP milestones sign 3-5 paid design partners and convert at least 2 pilots] 基准情形假设 Y1 下半年拿下 4 个付费试点。 A6 Y2 每季度新增付费客户 [1, 1, 2, 2] count [BP milestones 12-24 个月] 假设通过试点转化叠加首位 GTM 支持岗位,跑出温和的创始人主导增长。 A7 Y3 每季度新增付费客户 [3, 3, 4, 4] count [BP market.som 60 customers at about $90k ACV] 基准情形在 Y3 末达到 24 个客户,刻意低于 SOM 路径,以便对创始人主导的基础设施销售保持保守。 A8 年度价格阶梯 Y1 36.0;Y2 80.0;Y3 110.0 每年 USDK per customer [BP investorMemo.initialContract $20k-$40k paid pilot; BP gtm.pricing $60k-$120k 每年 ACV plus usage fees] 试点价格从区间中位附近起步,转生产后再靠用量费和治理增购抬到目标区间。 A9 收入确认规则 期间平均活跃客户数乘以年化合同价值 formula 创业财务经验法则:新企业客户平均会在期间中部激活,因此确认收入按 ((BoP + EoP) / 2) x 年化价格计算。 A10 毛利率爬坡 Y1 付费月份 50-60;Y2 各季度分别为 62、65、68、70;Y3 各季度分别为 71、72、72、72 百分比 [BP businessModel.targetGrossMarginPct 72; BP risks on browser fallback; Research sensitivityCases browser fallback] 只有当路由和缓存压低昂贵的浏览器路径和供应商过度使用后,毛利率才会往上走。 A11 全成本薪资区间 Founder 180;创始工程师 180;应用 ML/产品工程师 170;解决方案工程师 145;安全/平台工程师 170;GTM 负责人 170;客户成功 130;AE 155;平台工程师 160 每年 USDK per FTE [BP team roles] 再叠加面向美国 seed 阶段基础设施创业公司的创业财务经验法则,已包含薪资税和福利负担。 A12 招聘节奏 Founder 和创始工程师在 M1 入职;应用 ML/产品工程师在 M2;解决方案工程师在 M6;安全/平台工程师在 M9;GTM 负责人在 M12;客户成功/解决方案架构师在 M15;AE 在 M18;平台工程师在 M27 timing [BP team startTiming through Month 12] 再叠加创业财务经验法则:后续招聘要等试点证明和伙伴带来的商机管道更清楚后再开。 A13 薪资分摊规则 Founder 70% 计入 S&M、30% 计入 G&A;应用 ML/产品工程师 80% 计入 R&D、20% 计入 S&M;解决方案工程师 50% 计入 S&M、30% 计入 R&D、20% 计入 G&A;安全/平台工程师 85% 计入 R&D、15% 计入 G&A;客户成功 65% 计入 S&M、20% 计入 R&D、15% 计入 G&A;工程团队全部计入 R&D;GTM 和 AE 全部计入 S&M policy [BP team rationales; BP gtm; BP operations] 反映的是创始人主导销售、实施占比较高的试点,以及早期偏产品的组织结构。 A14 非薪资运营费用爬坡 S&M 每月 5-20;R&D 每月 10-22;G&A 每月 7-15 USDK 每月 [BP operations; BP fundingAsk.useOfFundsSummary] 再叠加精简 pre-seed 计划下的创业财务经验法则,覆盖云支出、评测跑数、差旅、法务和合规工具。 A15 稳态月流失率 1.25 百分比 创业财务经验法则:只要 ROI 可观测,基础设施年约通常留存不错;但品类仍早、供应商打包风险仍在,所以模型中的流失率高于最优基础设施留存水平。 A16 每客户混合 CAC 76.32 USDK 按模型中的 Y2-Y3 销售与市场费用 $1.526M 除以 20 个新客户计算;与创始人主导、技术型企业销售的特征一致。 A17 融资规模规则 打到下一轮可融资里程碑,并保留 6 个月缓冲 policy 根据开发者要求和 [BP fundingAsk runwayMonths 18],基准情形把本轮融资规模定在能打到 Y3 中段验证点并留出 H2Y3 缓冲,而不只是把首批试点启动起来。 A18 现金流简化规则 期末现金 = 期初现金 + 累计 EBITDA formula 创业财务经验法则:模型假设这是一门轻资产软件生意,capex、债务和营运资本扰动都可忽略。
单位经济模型流转 flowchart LR
QualifiedTeams[Qualified platform teams] --> PaidPilots[Paid pilots]
PaidPilots --> ProductionAccounts[Production accounts]
ProductionAccounts --> Revenue[Subscription and usage revenue]
Revenue --> GrossProfit[Gross profit after provider and browser costs]
GrossProfit --> Cash[Cash runway]
警示项: 模型到 Y3 末仍然 EBITDA 为负,因此它假设公司会凭高效率增长的证明再融一轮,而不是靠自身现金流滚动。 · 人均收入只摸到软件基准的低位,这意味着额外服务型工作或更快的支持团队扩张空间都不大。 · 毛利率假设浏览器兜底始终是少数路径;如果它高于 business-plan 里的风险阈值,融资需求就必须上调。
供应商打包下沉. 搜索供应商可能把自己的路由、缓存和可观测能力一起打包,压缩中间件层的空间。 缓解措施: 把重心放在多供应商治理、可回放能力和跨后端的来源策略控制上,而不是绑定某一家 API 的功能。 早期 ROI 不够硬. 如果团队的查询量还没到一定规模,它们未必会觉得有必要单独买一层检索控制平面。 缓解措施: 只打已经每月花 $25,000 以上做搜索的客户,把试点卖成一个能快速兑现硬节省和引用可靠性的项目。 代理技术栈变化太快. 框架频繁变动,会让深度嵌入式集成的维护成本很高。 缓解措施: 把集成点放在 API 代理和遥测层,这样模型、框架、搜索供应商换来换去,产品依旧有用。