两年增长千倍后，火山引擎谭待：AI马拉松才跑完第一公里

（文/陈济深编辑/张广凯）

2024年5月，火山引擎总裁谭待提出了一个判断：Token将成为AI时代的核心计量单位，以Token计费的MaaS（模型即服务）会是大模型最主流的商业形态。彼时豆包大模型刚发布，日均Token处理量1200亿。火山引擎一边把主力模型定价打到同行的1%，一边在内部把MaaS提到最高战略优先级。

同一时刻，其他云厂商还在聚焦私有化部署和项目制交付，MaaS并不被当成主流发展方向。有同行更是直言不讳，火山引擎的市场份额是亏钱换来的。

两年后，Token成了整个AI产业的中心词。黄仁勋把Token定义为新的硬通货——生成Token的成本与效率，直接决定科技企业的营收与生死。阿里巴巴3月成立了Alibaba Token Hub事业群，由CEO吴泳铭直接带队，围绕Token重组AI业务。腾讯云、阿里云、百度智能云接连涨价，Token调用量暴涨带来的算力供需失衡，正在重新定价整个行业。国家数据局局长刘烈宏给出全国数据：中国日均Token调用量两年增长超千倍，“一套以Token计费为基础的新型商业逻辑正在加速演进。”

4月2日，谭待在火山引擎武汉巡展上更新了火山引擎的成绩单：豆包大模型对外日均Token使用量突破120万亿，较去年12月的63万亿翻了近一倍，较两年前增长1000倍。累计Token使用量超一万亿的企业客户从100家增至140家。同场宣布的还有Seedance 2.0 API面向企业正式公测，以及龙虾类智能体产品ArkClaw的整体重构。

两年前还颇受质疑的判断，现在成了行业共识。不过谭待没有在这个数字上停留太久——在他看来，1000倍增长听起来很猛，但这场AI马拉松可能才跑完第一公里。

排队九万人，Seedance 2.0为何如今才公测

Seedance 2.0大概是过去两个月中国AI圈最让人又爱又恨的产品。2月发布后，它迅速成为几乎所有AI短剧、短片团队的标配工具。今年春晚《贺花神》《驭风歌》的视觉特效由它生成。谭待直接称之为“中国第一个毫无争议的全球SOTA视频模型”。

但伴随爆火的是排队、降智和版权争议。

Seedance 2.0高峰时段排队人数长期保持在9万左右，不少人排队7小时后，视频生成进度依然显示预计还需3小时。行业里绝大多数团队选择了“错峰生产”，甚至直接把工作时间调成夜班。旺盛的需求甚至催生了转卖API白名单的黄牛和骗子，有人开价10万元售卖一个月的“拼盘”服务。与此同时，高峰期输出质量波动、用户口中的“降智”也加剧了不满。

4月2日，火山引擎正式宣布Seedance 2.0 API面向企业公测。但API之所以到现在才开放，不是算力问题——是商业化的前提还没准备好，尤其是版权。

谭待说，传统版权保护技术已经覆盖不了AI生成的复杂度——同一个人物可能被生成为十年前的样子、素描风格、漫画风格，甚至穿古装的形象，这些变体都需要被识别和保护。火山引擎基于豆包VLM能力，重做了一套覆盖输入素材、中间产物和最终输出的全流程检测系统。没有这套系统，影视和广告客户不会放心买单。

有了版权保障，Seedance 2.0面对的下一个问题是成本。视频生成的Token消耗远超文本——一条1分钟720P视频消耗百万Token以上。但传统影视制作的成本更高。掌阅科技旗下的泡漫平台接入Seedance 2.0后，制作效率较传统模式提升逾一倍，制作成本下降70%。

据业内测算，Seedance 2.0在15秒视频生成上的可用率可达90%，明显高于此前行业约20%的平均水平；按短片项目口径测算，整体制作成本有望从过去的万元级降至数千元。这也意味着即便Seedance 2.0的Token单价比上一代贵，但效果更好、可用率更高，完成同样任务的总成本反而更低。谭待对此解释的很直白：“折扣低但干不了活，花10倍Token做不出来，全浪费了”——Token不能看单价，要算总账。

效果上的代际突破也在改变行业的使用习惯。此前AI视频制作普遍多模型混用，核心原因是各家模型能力相差不大，没有绝对领先者。但当一个模型出现代际突破，用户自然会集中到最优解上。从Seedance 2.0的使用和排队情况就能看出来，优质模型的调用集中度正在显著提升。

一天“死”了六百只龙虾，问题出在哪

火山引擎Token调用暴涨的另一个引擎来自智能体。今年2月，开源框架OpenClaw引爆了全球龙虾热潮——用户可以在自己的电脑上部署一个AI助手，让它操作浏览器、处理文件、执行各种任务。火山引擎迅速跟进，推出了企业级龙虾产品ArkClaw。

和文本对话不同，Agent完成一个任务需要几十上百轮工具调用，单次消耗轻松到几十万Token，直接拉高了整个Token消耗的量级。谭待说，龙虾很难归类到任何一个行业——有人招聘，有人做市场分析，有人处理周报，本质是给每个人的工作方式加了一个AI助手。

但龙虾的真实体感，和它的热度并不匹配。火山引擎发布会前做了近千份用户调研，用户最多的诉求不是什么高级场景，就是替代重复操作、处理文件这些最朴素的事。超过30%的用户说，无论养多久，都达不到预期。

问题出在哪？谭待坦言：“今天布置的任务，第二天龙虾就忘了，但消耗的Token一点没少。”

记忆断层是最普遍的痛点，但显然不是唯一的问题。火山引擎云基础产品负责人田涛涛的数字更扎心——他管着几十万个ArkClaw，最多一天有600个龙虾直接“死了”，因为执行某些指令后系统就崩了。不敢用、用不好、坏了修不了，这不只是火山一家的问题，是整个龙虾生态的现状。

火山引擎这次的回应是把ArkClaw从底层重构，做成默认安全、开箱即用的企业级产品。记忆问题有一个专门的解法：开源数据库OpenViking，上线两个月登顶GitHub Trending，核心思路是让龙虾不再把所有信息一股脑塞进上下文，而是像翻档案一样按需调取，实测Token成本降了九成。在此基础上，Vaka知识助手把豆包、龙虾和OpenViking打包成企业开箱即用的方案，ClawHub中国镜像站同步精选超2万个Skills供国内开发者直接使用。据火山引擎介绍，其已拿下信通院智能体可信能力和安全防护两项认证，是国内唯一同时获得的厂商。

能不能让那三成用户改变看法，是接下来要回答的问题。但即便产品好用了，企业真正要把龙虾用到业务里，还有一个更前置的顾虑：我的数据交给谁？

很多企业的第一反应是私有化部署，把模型和数据都放在自己手里。谭待认为这个想法可以理解，但这条路走不通——模型三个月迭代一次，整套Agent运行环境私有化根本跟不上。“你搞3个月，3个月就过期了。”他给出的替代方案是机密计算：通过芯片级可信执行环境，让数据在处理时可用不可见，从技术上让安全变成可以被验证的事实，而不是一句承诺。“就像解数学题一样，你证明它是安全的，那就是安全的。”联想、OPPO和多家金融企业已经在用这套方案。谭待的判断很明确：公有云MaaS不只是用起来方便，而是企业能否持续跟上AI迭代速度的前提。

大多数企业跳过了最重要的一步

产品能不能用、数据安不安全，解决的都是具体问题。但谭待对观察者网表示，他和企业交流时最常听到的困惑比这些更根本——“去年干了很多事，今年就没有沉淀出来。”

面对智能体热潮，很多企业的做法是选一个场景、找一个模型、直接上线、要求立竿见影。但大多数企业连自己的AI用法都还没找到，就想要规模化落地。

谭待把企业Agent分成敏态和稳态两条路径。

敏态以ArkClaw为代表，核心是给员工自由探索的空间，不预设正确答案。招聘HR用来筛简历，运营用来追热点，销售用来做客户分析——每个人的用法不同，好的用法是试出来的，不是规划出来的。敏态的价值不在于每次都成功，而在于低成本地找到哪些场景AI真正有用。

稳态以HiAgent为代表，做的事情相反：把敏态中跑通的最佳实践固化成标准流程和Skill，在组织内规模化复用。这个阶段才开始认真算成本、盯准确率、做质量控制。

两条路径不是前后替代，而是同时运转。某个HR用ArkClaw试出来的简历筛选方法，三个月后可能变成全公司招聘团队的标准动作；某个销售摸出来的客户分析流程，半年后可能沉淀成几百人每天调用的Skill。敏态不断产出洞见，稳态不断把洞见放大为组织能力，这个循环越顺畅，企业AI落地形成的组织势能就越大。

谭待认为，大多数企业在AI落地上卡住，不是因为模型不够好，而是还没经历过那个看起来低效、混乱、充满无效尝试的探索阶段——而那恰恰是找到有效用法的必经阶段。

天翻地覆之后，行业马拉松只跑完了一公里

2025年6月，谭待公开表示AI行业马拉松才跑了500米，“未来市场空间最少会扩大100倍”。彼时豆包大模型日均Token是16.4万亿，没有Seedance 2.0，没有龙虾，连豆包2.0系列模型都还没有发布。

不到一年，情况已经天翻地覆：豆包大模型日均Token消耗突破120万亿，Seedance 2.0成了全球SOTA级视频模型，相关成果也登上了春晚，龙虾从概念变成百万人在用的产品。

但谭待的最新判断是：目前行业发展仅仅跑完了第一公里。

对于龙虾是不是走向AGI的转折点的问题。谭待的回答没有豪言壮语：“电脑是伟大的发明，那软盘在电脑发明史上是什么地位？到AGI时代回头看，龙虾是软盘级别的里程碑，还是更高？不好说。”

2024年火山引擎押Token的时候，很少有人预见到Seedance会让视频创作的Token消耗飙升百万级，也没有预见到龙虾会让每个用户的单次消耗跳涨一个量级。火山引擎押对的不是具体哪个场景会爆发，而是更底层的一件事：Token是度量AI价值的基础设施，只要把路修好，车会自己开上来。

上一次，火山引擎押对了Token；这一次，它押的不是一个产品或场景，而是一套新的落地逻辑。它会不会再次成立，还要时间往前走。