9 月 9 日消息,字节跳动今天正式发布 Seedream 4.0 图像创作模型,相比前代 Seedream 3.0 和 SeedEdit 3.0 模型主要增强逻辑理解能力、提升推理速度。
这款模型现已在豆包 App、即梦网页端上线,用户只需要在上传参考图后选择“图片 4.0 模型”即可体验。
附本次更新要点如下:
一、精准编辑:
用户只需通过文本提示即可实现高质量修改,可执行添加、删除、修改、替换等操作,在保证画面完整性的同时,完成背景替换、人物修饰等复杂任务。
二、灵活参考:
Seedream 4.0 能从参考图像中抽取人物身份、艺术风格或结构特征等关键信息,尝试在全新场景下进行再造图片。目前该模型可基于二维人像生成一张三维手办图,可在虚拟形象创造、衍生设计和二次创作领域中应用。
三、视觉信号可控生成:
传统上,系统需要依赖 ControlNet 等额外模型才能利用 Canny、Depth、Mask 等视觉信号,Seedream 4.0 则原生集成了这些能力,用户可通过简单的草图、涂鸦或辅助线,直接引导生成目标图像。
四、上下文推理生成:
该模型可理解物理与时间约束、三维空间等复杂语境,号称是具备推理能力的“上下文推理生成”,用户可通过文本描述“室内时间过了 11 个小时”,生成对应图片。
五、多图参考生成:
该模型最多支持导入十余张参考图,自动抽取人物特征、场景风格和物体结构,实现“动嘴 P 图”。
六、多图输出:
Seedream 4.0 能保持全局规划与上下文一致性,可以生成角色连贯、风格统一的图像序列,适合分镜、漫画创作、需要统一视觉风格的成套设计。
七、高级文字渲染与排版:
Seedream 4.0 能正确渲染出清晰的文字,还能一定程度上处理公式、表格、化学结构、统计图等复杂排版,适合生成教育课件、学术插图场景,后续还能支持文字替换、编辑。
八、自适应比例与 4K 生成:
Seedream 4.0 生成分辨率扩展到 4K 超高清,引入自适应长宽比机制,可根据语义需求或参考物体形状自动调整画布,并支持用户自定义尺寸,生成更美观合理的构图。