字节跳动豆包视频生成大模型发布：支持多风格多比例的一致性多镜头生成

2024-09-24 / 阅读约1分钟

来源：IT之家

火山引擎总裁谭待表示，豆包视频生成大模型支持多风格多比例的一致性多镜头生成，可应用在电商营销、动画教育、城市文旅、微剧本等领域。

IT之家 9 月 24 日消息，字节跳动火山引擎正式发布豆包视频生成大模型，支持高效的 DiT 融合计算单元、全新设计的扩散模型训练方法和深度优化的 Transformer 结构，可以实现更充分地压缩编码视频与文本，支持一致性多镜头生成，能够大幅提升视频生成的泛化能力。

火山引擎总裁谭待表示，豆包视频生成大模型支持多风格多比例的一致性多镜头生成，可应用在电商营销、动画教育、城市文旅、微剧本等领域。

此外，谭待表示，豆包大模型发布以来，使用量爆发式增长。豆包大模型日均 tokens 使用量超过 1.3 万亿，日均生成图片 5000 万张，日均处理语音 85 万小时。

1 天前

AMD发布针对手持设备的Ryzen Z2系列处理器

2 天前

英特尔向客户提供基于18A技术的Panther Lake样品

1 天前

1 天前

传每片1.8万美元台积电3nm苹果代工价曝光

1 天前

美对陆系成熟制程开刀伤敌八百恐自损一千

1 天前

1 天前

英伟达 DLSS 4 发布：号称帧率提升 8 倍，首发支持超 75 款游戏和应用

1 天前

TI、ADI、三星…这些芯片热度升温、在涨价！

1 天前

争先恐后和英伟达搞合作，股价立即腾飞，微软800亿美元搞AI

1 天前

英伟达携手台积电押注硅光子学，共筑 AI 芯片新高地