人像图转手办图、渲染文字支持编辑，字节跳动发布 Seedream 4.0 图像创作模型

作者：

在

9 月 9 日消息，字节跳动今天正式发布 Seedream 4.0 图像创作模型，相比前代 Seedream 3.0 和 SeedEdit 3.0 模型主要增强逻辑理解能力、提升推理速度。

这款模型现已在豆包 App、即梦网页端上线，用户只需要在上传参考图后选择“图片 4.0 模型”即可体验。

附本次更新要点如下：

一、精准编辑：

用户只需通过文本提示即可实现高质量修改，可执行添加、删除、修改、替换等操作，在保证画面完整性的同时，完成背景替换、人物修饰等复杂任务。

Seedream 4.0 能从参考图像中抽取人物身份、艺术风格或结构特征等关键信息，尝试在全新场景下进行再造图片。目前该模型可基于二维人像生成一张三维手办图，可在虚拟形象创造、衍生设计和二次创作领域中应用。

传统上，系统需要依赖 ControlNet 等额外模型才能利用 Canny、Depth、Mask 等视觉信号，Seedream 4.0 则原生集成了这些能力，用户可通过简单的草图、涂鸦或辅助线，直接引导生成目标图像。

该模型可理解物理与时间约束、三维空间等复杂语境，号称是具备推理能力的“上下文推理生成”，用户可通过文本描述“室内时间过了 11 个小时”，生成对应图片。

该模型最多支持导入十余张参考图，自动抽取人物特征、场景风格和物体结构，实现“动嘴 P 图”。

Seedream 4.0 能保持全局规划与上下文一致性，可以生成角色连贯、风格统一的图像序列，适合分镜、漫画创作、需要统一视觉风格的成套设计。

Seedream 4.0 能正确渲染出清晰的文字，还能一定程度上处理公式、表格、化学结构、统计图等复杂排版，适合生成教育课件、学术插图场景，后续还能支持文字替换、编辑。

Seedream 4.0 生成分辨率扩展到 4K 超高清，引入自适应长宽比机制，可根据语义需求或参考物体形状自动调整画布，并支持用户自定义尺寸，生成更美观合理的构图。