(文/陈济深 编辑/张广凯)

2024年5月,火山引擎总裁谭待提出了一个判断:Token将成为AI时代的核心计量单位,以Token计费的MaaS(模型即服务)会是大模型最主流的商业形态。彼时豆包大模型刚发布,日均Token处理量1200亿。火山引擎一边把主力模型定价打到同行的1%,一边在内部把MaaS提到最高战略优先级。

同一时刻,其他云厂商还在聚焦私有化部署和项目制交付,MaaS并不被当成主流发展方向。有同行更是直言不讳,火山引擎的市场份额是亏钱换来的。

两年后,Token成了整个AI产业的中心词。黄仁勋把Token定义为新的硬通货——生成Token的成本与效率,直接决定科技企业的营收与生死。阿里巴巴3月成立了Alibaba Token Hub事业群,由CEO吴泳铭直接带队,围绕Token重组AI业务。腾讯云、阿里云、百度智能云接连涨价,Token调用量暴涨带来的算力供需失衡,正在重新定价整个行业。国家数据局局长刘烈宏给出全国数据:中国日均Token调用量两年增长超千倍,“一套以Token计费为基础的新型商业逻辑正在加速演进。”

4月2日,谭待在火山引擎武汉巡展上更新了火山引擎的成绩单:豆包大模型对外日均Token使用量突破120万亿,较去年12月的63万亿翻了近一倍,较两年前增长1000倍。累计Token使用量超一万亿的企业客户从100家增至140家。同场宣布的还有Seedance 2.0 API面向企业正式公测,以及龙虾类智能体产品ArkClaw的整体重构。

两年前还颇受质疑的判断,现在成了行业共识。不过谭待没有在这个数字上停留太久——在他看来,1000倍增长听起来很猛,但这场AI马拉松可能才跑完第一公里。

排队九万人,Seedance 2.0为何如今才公测

Seedance 2.0大概是过去两个月中国AI圈最让人又爱又恨的产品。2月发布后,它迅速成为几乎所有AI短剧、短片团队的标配工具。今年春晚《贺花神》《驭风歌》的视觉特效由它生成。谭待直接称之为“中国第一个毫无争议的全球SOTA视频模型”。

但伴随爆火的是排队、降智和版权争议。

Seedance 2.0高峰时段排队人数长期保持在9万左右,不少人排队7小时后,视频生成进度依然显示预计还需3小时。行业里绝大多数团队选择了“错峰生产”,甚至直接把工作时间调成夜班。旺盛的需求甚至催生了转卖API白名单的黄牛和骗子,有人开价10万元售卖一个月的“拼盘”服务。与此同时,高峰期输出质量波动、用户口中的“降智”也加剧了不满。

4月2日,火山引擎正式宣布Seedance 2.0 API面向企业公测。但API之所以到现在才开放,不是算力问题——是商业化的前提还没准备好,尤其是版权。

谭待说,传统版权保护技术已经覆盖不了AI生成的复杂度——同一个人物可能被生成为十年前的样子、素描风格、漫画风格,甚至穿古装的形象,这些变体都需要被识别和保护。火山引擎基于豆包VLM能力,重做了一套覆盖输入素材、中间产物和最终输出的全流程检测系统。没有这套系统,影视和广告客户不会放心买单。

有了版权保障,Seedance 2.0面对的下一个问题是成本。视频生成的Token消耗远超文本——一条1分钟720P视频消耗百万Token以上。但传统影视制作的成本更高。掌阅科技旗下的泡漫平台接入Seedance 2.0后,制作效率较传统模式提升逾一倍,制作成本下降70%。

据业内测算,Seedance 2.0在15秒视频生成上的可用率可达90%,明显高于此前行业约20%的平均水平;按短片项目口径测算,整体制作成本有望从过去的万元级降至数千元。这也意味着即便Seedance 2.0的Token单价比上一代贵,但效果更好、可用率更高,完成同样任务的总成本反而更低。谭待对此解释的很直白:“折扣低但干不了活,花10倍Token做不出来,全浪费了”——Token不能看单价,要算总账。

效果上的代际突破也在改变行业的使用习惯。此前AI视频制作普遍多模型混用,核心原因是各家模型能力相差不大,没有绝对领先者。但当一个模型出现代际突破,用户自然会集中到最优解上。从Seedance 2.0的使用和排队情况就能看出来,优质模型的调用集中度正在显著提升。

一天“死”了六百只龙虾,问题出在哪

火山引擎Token调用暴涨的另一个引擎来自智能体。今年2月,开源框架OpenClaw引爆了全球龙虾热潮——用户可以在自己的电脑上部署一个AI助手,让它操作浏览器、处理文件、执行各种任务。火山引擎迅速跟进,推出了企业级龙虾产品ArkClaw。

和文本对话不同,Agent完成一个任务需要几十上百轮工具调用,单次消耗轻松到几十万Token,直接拉高了整个Token消耗的量级。谭待说,龙虾很难归类到任何一个行业——有人招聘,有人做市场分析,有人处理周报,本质是给每个人的工作方式加了一个AI助手。

但龙虾的真实体感,和它的热度并不匹配。火山引擎发布会前做了近千份用户调研,用户最多的诉求不是什么高级场景,就是替代重复操作、处理文件这些最朴素的事。超过30%的用户说,无论养多久,都达不到预期。

问题出在哪?谭待坦言:“今天布置的任务,第二天龙虾就忘了,但消耗的Token一点没少。”

记忆断层是最普遍的痛点,但显然不是唯一的问题。火山引擎云基础产品负责人田涛涛的数字更扎心——他管着几十万个ArkClaw,最多一天有600个龙虾直接“死了”,因为执行某些指令后系统就崩了。不敢用、用不好、坏了修不了,这不只是火山一家的问题,是整个龙虾生态的现状。

火山引擎这次的回应是把ArkClaw从底层重构,做成默认安全、开箱即用的企业级产品。记忆问题有一个专门的解法:开源数据库OpenViking,上线两个月登顶GitHub Trending,核心思路是让龙虾不再把所有信息一股脑塞进上下文,而是像翻档案一样按需调取,实测Token成本降了九成。在此基础上,Vaka知识助手把豆包、龙虾和OpenViking打包成企业开箱即用的方案,ClawHub中国镜像站同步精选超2万个Skills供国内开发者直接使用。据火山引擎介绍,其已拿下信通院智能体可信能力和安全防护两项认证,是国内唯一同时获得的厂商。

能不能让那三成用户改变看法,是接下来要回答的问题。但即便产品好用了,企业真正要把龙虾用到业务里,还有一个更前置的顾虑:我的数据交给谁?

很多企业的第一反应是私有化部署,把模型和数据都放在自己手里。谭待认为这个想法可以理解,但这条路走不通——模型三个月迭代一次,整套Agent运行环境私有化根本跟不上。“你搞3个月,3个月就过期了。”他给出的替代方案是机密计算:通过芯片级可信执行环境,让数据在处理时可用不可见,从技术上让安全变成可以被验证的事实,而不是一句承诺。“就像解数学题一样,你证明它是安全的,那就是安全的。”联想、OPPO和多家金融企业已经在用这套方案。谭待的判断很明确:公有云MaaS不只是用起来方便,而是企业能否持续跟上AI迭代速度的前提。

大多数企业跳过了最重要的一步

产品能不能用、数据安不安全,解决的都是具体问题。但谭待对观察者网表示,他和企业交流时最常听到的困惑比这些更根本——“去年干了很多事,今年就没有沉淀出来。”

面对智能体热潮,很多企业的做法是选一个场景、找一个模型、直接上线、要求立竿见影。但大多数企业连自己的AI用法都还没找到,就想要规模化落地。

谭待把企业Agent分成敏态和稳态两条路径。

敏态以ArkClaw为代表,核心是给员工自由探索的空间,不预设正确答案。招聘HR用来筛简历,运营用来追热点,销售用来做客户分析——每个人的用法不同,好的用法是试出来的,不是规划出来的。敏态的价值不在于每次都成功,而在于低成本地找到哪些场景AI真正有用。

稳态以HiAgent为代表,做的事情相反:把敏态中跑通的最佳实践固化成标准流程和Skill,在组织内规模化复用。这个阶段才开始认真算成本、盯准确率、做质量控制。

两条路径不是前后替代,而是同时运转。某个HR用ArkClaw试出来的简历筛选方法,三个月后可能变成全公司招聘团队的标准动作;某个销售摸出来的客户分析流程,半年后可能沉淀成几百人每天调用的Skill。敏态不断产出洞见,稳态不断把洞见放大为组织能力,这个循环越顺畅,企业AI落地形成的组织势能就越大。

谭待认为,大多数企业在AI落地上卡住,不是因为模型不够好,而是还没经历过那个看起来低效、混乱、充满无效尝试的探索阶段——而那恰恰是找到有效用法的必经阶段。

天翻地覆之后,行业马拉松只跑完了一公里

2025年6月,谭待公开表示AI行业马拉松才跑了500米,“未来市场空间最少会扩大100倍”。彼时豆包大模型日均Token是16.4万亿,没有Seedance 2.0,没有龙虾,连豆包2.0系列模型都还没有发布。

不到一年,情况已经天翻地覆:豆包大模型日均Token消耗突破120万亿,Seedance 2.0成了全球SOTA级视频模型,相关成果也登上了春晚,龙虾从概念变成百万人在用的产品。

但谭待的最新判断是:目前行业发展仅仅跑完了第一公里。

对于龙虾是不是走向AGI的转折点的问题。谭待的回答没有豪言壮语:“电脑是伟大的发明,那软盘在电脑发明史上是什么地位?到AGI时代回头看,龙虾是软盘级别的里程碑,还是更高?不好说。”

2024年火山引擎押Token的时候,很少有人预见到Seedance会让视频创作的Token消耗飙升百万级,也没有预见到龙虾会让每个用户的单次消耗跳涨一个量级。火山引擎押对的不是具体哪个场景会爆发,而是更底层的一件事:Token是度量AI价值的基础设施,只要把路修好,车会自己开上来。

上一次,火山引擎押对了Token;这一次,它押的不是一个产品或场景,而是一套新的落地逻辑。它会不会再次成立,还要时间往前走。