豆包大模型2.1正式发布,日均调用量突破180万亿

    6月23日,在火山引擎2026夏季FORCE原动力大会上,豆包大模型家族迎来了一次集中亮相。此次发布的五款新模型,共同标志着豆包在基础大模型和多模态生成两大方向实现了全面升级。

    豆包大模型2.1:跨越生产级“质变点”

    作为本次大会的主力模型,豆包大模型2.1(Pro版) 聚焦Coding(编程)、Agent(智能体)及VLM(视觉语言模型) 三大核心生产场景,完成了能力的全面跃升。在多项国际权威评测中,其成绩已进入全球第一梯队,正式跨越了“生产级质变点”。

    性能验证:在一项芯片设计RTL代码测试中,该模型连续运行近18小时,完成了1300多行代码的编写与迭代,并跑通了完整的工程验证流程。其搭建的3D虚拟城市可实现500余个智能Agent同步协作。

    成本优势:豆包2.1 Pro版定价为每百万Tokens输入6元、输出30元,缓存命中仅1.2元,综合使用成本较Claude Opus 4.6降低近80%。针对高频调用场景的Turbo版本,价格进一步减半。

    商业化进展:目前,豆包2.1的API服务已在火山引擎开放。截至今年6月,豆包大模型日均Token调用量已突破180万亿,过去一年增长超10倍。火山引擎以49.5% 的份额位居中国公有云MaaS服务市场第一。

    视频生成模型:从Seedance 2.0到2.5

    在视频生成领域,豆包推出了两款关键模型:

    Seedance 2.0(已升级):正式支持原生4K直出,并成为行业首个支持10-bit高位深原生直出的视频模型。其工作日调用量已反超周末,完成了从娱乐工具到生产力工具的跃迁。

    Seedance 2.5(首次亮相):作为面向未来的下一代模型,它支持30秒单段原生视频直出,可同时导入多达50个全模态素材进行联合生成。该模型预计于7月正式上线。

    图像与音频模型:首次亮相

    本次大会,豆包还首次推出了图像和音频创作模型。

    Seedream 5.0 Pro(图像创作):最大亮点是交互式精准编辑,用户可用画箭头、圈选等直觉方式修改图像。它还具备多图层分离能力,可对任意内容进行拆层和独立编辑。模型原生支持14种语言的文字生成。

    音频生成模型1.0:支持在单次生成中,同步完成角色对白、情绪语气、方言口音、背景音乐及拟音特效的编排与生成。

    豆包大模型2.1已经跨越了生产级应用的“质变点”,展现了国产大模型在核心生产场景中的扎实能力。而Seedance 2.5、Seedream 5.0 Pro等模型在多模态领域的亮相,也让我们看到了AI内容创作的更多可能性。未来,这些模型在实体产业中的落地应用值得期待。