IT之家 9 月 24 日消息,字节跳动火山引擎正式发布豆包视频生成大模型,支持高效的 DiT 融合计算单元、全新设计的扩散模型训练方法和深度优化的 Transformer 结构,可以实现更充分地压缩编码视频与文本,支持一致性多镜头生成,能够大幅提升视频生成的泛化能力。
火山引擎总裁谭待表示,豆包视频生成大模型支持多风格多比例的一致性多镜头生成,可应用在电商营销、动画教育、城市文旅、微剧本等领域。
此外,谭待表示,豆包大模型发布以来,使用量爆发式增长。豆包大模型日均 tokens 使用量超过 1.3 万亿,日均生成图片 5000 万张,日均处理语音 85 万小时。