12 月 18 日消息,日前,微软开源了最新的 AI 工具 ——TRELLIS.2,根据页面介绍,TRELLIS.2 是一个大型 3D 生成模型,具备 40 亿参数,专为高保真图像到 3D 生成而设计。其构建于原生 3D VAE 之上,可生成高达 1536³ PBR 纹理资产,具有 16 倍空间压缩,可实现高效、可扩展、高保真资产生成。

从介绍获悉,该模型利用一种被称为 O-Voxel 的全新“无场”稀疏体素结构,来重建和生成具有复杂拓扑、锐利特征和完整 PBR 材质的任意 3D 资产。

其具备如下特点:

高质量、高分辨率、高效率:40 亿参数的模型使用原始 DiT 生成具有“卓越保真度和效率”的高分辨率、完全纹理化的资产,利用具有 16 倍空间下采样的稀疏 3D VAE 将资产编码成紧凑的潜在空间。在英伟达 H100 GPU 上测试,生成 512³ 分辨率的 3D 模型仅需约 3 秒。

任意拓扑处理:打破了等值面场限制,可以稳健处理复杂结构,且不会造成有损转换。

纹理建模丰富:除了基本颜色之外,TRELLIS.2 还可以对任意表面属性进行建模,包括基本颜色、粗糙度、金属度和不透明度,从而实现照片级真实感渲染和透明度支持。

极简处理:数据处理经过简化,可实现即时转换,完全无需渲染和优化。

参考

参考

项目主页

GitHub 页面

体验项目(Hugging Face)

本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:[email protected]