感谢网友 Diixx、啊俊 的线索投递!
12 月 16 日消息,字节跳动 Seed 今日发布了新一代音视频创作模型 Seedance 1.5 pro。
Seedance 1.5 pro 支持音视频联合生成,它能够执行多种任务,包括从文本到音视频的合成以及图像引导的音视频生成等。至此,Seedance 视频生成不再局限于视觉维度,而是自然融合了声音。

在 Seedance 1.0 版本中,模型更侧重改善模型表现的“下限”,优化了运动生成的稳定性;而 Seedance 1.5 pro 除了支持音频同步生成外,还致力于提升视觉冲击力和运动效果的“上限”。通过采用更加大胆的技术方案,Seedance 1.5 pro 在视听协同、视觉张力和叙事协调性等方面实现突破:
-
精准音画同步与多语言、方言支持:模型在生成中实现了较高的视听一致性,提升了角色的口型、语调与表演节奏的拟合精度。模型原生支持多语种和特色方言口音,能够捕捉其独有的语音韵律与情感张力。
-
电影级运镜控制与动态张力:模型具备自发的镜头调度能力,可执行长镜头跟随、希区柯克变焦等高难度运镜,同时还能实现电影级的画面衔接与专业影调,提升了视频的动态张力。
-
语义理解与叙事协调性增强:通过增强语义理解,模型实现了对叙事语境的较好解析。它提升了音视频段落的整体叙事协调性,为专业级内容创作提供支撑。
字节跳动 Seed 表示,在综合评测中,Seedance 1.5 pro 各项关键能力处于“业界前列”。目前,Seedance 1.5 pro 已上线即梦 AI 和豆包。附地址如下:
https://seed.bytedance.com/seedance1_5_pro


