2025年6月11日,字节跳动旗下的云服务平台火山引擎在FORCE原动力大会上正式发布了豆包大模型1.6以及视频生成模型Seedance 1.0 pro。此次发布标志着字节跳动在AI大模型领域的持续创新与技术突破,旨在满足市场对智能体(Agent)部署的新增需求,并推动AI技术在各行业的广泛应用。
一、豆包大模型1.6
豆包大模型1.6是火山引擎推出的一系列新模型中的核心产品,由三个主要模型组成:doubao-seed-1.6、doubao-seed-1.6-thinking 和 doubao-seed-1.6-flash。其中,doubao-seed-1.6 是一个一体化的综合模型,具备深度思考、多模态理解、图形界面操作等能力。该模型支持自适应思考模式,根据指令难度自动决定是否开启思考,从而减少 tokens 开销,提升效率。与上一代模型相比,豆包1.6在可比口径下节省了63%的成本,显著降低了使用门槛,推动了字节跳动云业务市场份额的快速提升。
豆包1.6的另一大亮点是其支持256K上下文长度,这是国内首个支持如此长上下文的推理模型。这一能力使得豆包能够处理更复杂、更长的文本输入,从而更好地理解和生成内容。此外,豆包1.6还引入了“区间定价”方案,综合成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一,进一步降低了企业的使用成本。
二、豆包·视频生成模型Seedance 1.0 pro
在视频生成领域,火山引擎同步发布了Seedance 1.0 pro。该模型支持文字与图片输入,能够生成多镜头无缝切换的1080P高品质视频,主体运动稳定性与画面自然度较高。在国际知名评测榜单Artificial Analysis上,Seedance在文生视频和图生视频两项任务上均排名首位,超越了Veo3和可灵2.0等优秀模型。Seedance 1.0 pro的价格同样具有竞争力,每千 tokens 仅需0.015元,生成一条5秒的1080P视频只需3.67元,为行业最低。
三、技术优势与应用场景
豆包大模型1.6和Seedance 1.0 pro在技术上实现了多项突破。例如,豆包1.6支持多模态理解和图形界面操作,能够理解和处理真实世界问题。演示案例显示,豆包1.6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。而Seedance 1.0 pro则在视频生成方面表现出色,支持动态帧率采样、视频时序定位能力,结合向量搜索,可精准定位视频中与文本描述相对应的片段。
在应用场景上,豆包大模型已广泛应用于电商、教育、旅游、广告等多个领域。例如,豆包视觉理解模型能够识别图像中的物体类别、形状等基本要素,并理解物体之间的关系和场景含义,适用于多个行业。Seedance 1.0 pro则在电商广告、影视分镜、游戏剧情生成等领域展现出巨大潜力。
四、行业影响与未来展望
豆包大模型1.6和Seedance 1.0 pro的发布,不仅在技术上实现了突破,也在使用成本上实现了大幅降低,显示出AI在各个领域应用的巨大潜力。据火山引擎总裁谭待介绍,豆包大模型日均 tokens 使用量超过4万亿,较5月发布时期增长超过33倍。此外,豆包大模型已覆盖全球TOP10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校,显示出其在行业中的广泛应用。
字节跳动CEO梁汝波表示,AI发展还处于早期阶段,只是马拉松的前500米。字节跳动致力于成为优秀的创新科技公司,通过火山引擎持续把新模型、新技术开放给企业客户,推动AI技术的普及与应用。
五、总结
2025年6月11日,火山引擎正式发布了豆包大模型1.6和视频生成模型Seedance 1.0 pro。这些新模型在技术上实现了多项突破,包括支持256K上下文长度、多模态理解和图形界面操作、以及高效的视频生成能力。同时,它们在使用成本上也实现了大幅降低,为更多企业和开发者提供了尝试和应用AI技术的机会。未来,随着AI技术的不断发展,豆包大模型有望在更多领域发挥重要作用,推动AI应用的普及与创新