苹果发布全新AI模型 单张图片即可生成逼真3D物体

  【CNMO科技消息】近日,苹果公司公布一项名为LiTo的AI研究成果,该模型可通过单张二维图像生成具有真实光照效果的完整3D物体,包括反射、高光等随视角变化的细节。这项突破性技术有望革新3D建模、虚拟现实及增强现实领域的应用开发。

苹果发布全新AI模型 单张图片即可生成逼真3D物体

  传统3D重建技术通常依赖多角度图像或深度数据,而LiTo模型通过创新性的”3D潜在空间表示”方法,将物体几何结构与光照交互特性统一编码。研究团队解释称,模型通过分析RGB-D图像中的表面光场样本,将其压缩为紧凑的潜在向量集合,从而在统一的三维空间中同时表征物体形态与材质特性。这种设计使得模型能够精准复现镜面高光、菲涅尔反射等复杂光照现象,即使面对单一输入图像也能生成多视角一致的3D模型。

  技术实现层面,LiTo采用编码器-解码器架构。编码器将物体信息压缩为数学描述,包含形状特征与表面光交互规律;解码器则基于该描述重建完整3D模型,并动态生成不同视角下的光照效果。训练过程中,研究人员使用150个视角、3种光照条件下渲染的数千个物体数据集,通过随机子采样方式迫使模型学习核心特征,最终实现仅需单张图像即可预测完整潜在表示的能力。

苹果发布全新AI模型 单张图片即可生成逼真3D物体

  对比实验显示,相较于传统模型TRELLIS,LiTo在镜面反射、透明材质等复杂光照场景中表现显著提升。苹果项目页面提供的交互式对比工具直观展示了技术优势:当旋转重建物体时,LiTo模型生成的高光位置、反射强度等细节均保持物理合理性,而对照模型则出现明显失真。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平