字节跳动发布 Seedance 1.5 pro 模型,支持音视频联合生成

感谢网友 Diixx、啊俊 的线索投递!

12 月 16 日消息,字节跳动 Seed 今日发布了新一代音视频创作模型 Seedance 1.5 pro

Seedance 1.5 pro 支持音视频联合生成,它能够执行多种任务,包括从文本到音视频的合成以及图像引导的音视频生成等。至此,Seedance 视频生成不再局限于视觉维度,而是自然融合了声音。

在 Seedance 1.0 版本中,模型更侧重改善模型表现的“下限”,优化了运动生成的稳定性;而 Seedance 1.5 pro 除了支持音频同步生成外,还致力于提升视觉冲击力和运动效果的“上限”。通过采用更加大胆的技术方案,Seedance 1.5 pro 在视听协同、视觉张力和叙事协调性等方面实现突破:

  • 精准音画同步与多语言、方言支持:模型在生成中实现了较高的视听一致性,提升了角色的口型、语调与表演节奏的拟合精度。模型原生支持多语种和特色方言口音,能够捕捉其独有的语音韵律与情感张力。

  • 电影级运镜控制与动态张力:模型具备自发的镜头调度能力,可执行长镜头跟随、希区柯克变焦等高难度运镜,同时还能实现电影级的画面衔接与专业影调,提升了视频的动态张力。

  • 语义理解与叙事协调性增强:通过增强语义理解,模型实现了对叙事语境的较好解析。它提升了音视频段落的整体叙事协调性,为专业级内容创作提供支撑。

字节跳动 Seed 表示,在综合评测中,Seedance 1.5 pro 各项关键能力处于“业界前列”。目前,Seedance 1.5 pro 已上线即梦 AI 和豆包。附地址如下:

https://seed.bytedance.com/seedance1_5_pro

▲ Seedance 1.5 pro 视频生成能力评测

▲ Seedance 1.5 pro 音频生成能力评测

Published by

风君子

独自遨游何稽首 揭天掀地慰生平