全国首个Token服务性能监测平台发布

    6月16日,“高质量Token服务研讨会”上,中国信通院正式发布全国首个Token服务性能监测平台。该平台实时对国内外30多个平台、上百款大模型Token服务的调用成功率、输出速度(TPS)、首词时延(TTFT)等几十项核心指标,进行每日多时、多地点持续性监测。平台将为行业提供选型指引,为Token服务商提供能力提升标尺,也为政府机构提供监测服务支撑。

    数据显示,截至2026年3月,我国日均词元调用量已超140万亿次。公有云企业级Token消耗量增长尤为显著,2025年调用量达2000万亿,较2024年增长超16倍,2026年一季度预测同样约2000万亿。中国信通院人工智能研究所所长魏凯指出,开源与闭源模型的智能差距正不断缩小,但不同模型输出的“智能含金量”相差甚远,业界关注焦点正从“调用量”转向“高质量”。他强调,提升Token服务性价比,需兼顾调用成本、用户体验、绿色能耗与应用价值,按场景选择适配服务。

    下一步,Token服务性能监测平台将推动行业完善评价体系、加强性能监测、健全安全保障、提升运营效能,进一步释放Token服务的技术价值与产业价值。