当前位置：首页 > AI工具 > AI 编程开发 > 书生·物华2.0（3DTopia 2.0）

书生·物华2.0（3DTopia 2.0）

316

2025-03-15

AI开源项目

书生·物华2.0（3DTopia 2.0）是一款由上海人工智能实验室与南洋理工大学等机构联合开发的三维物体生成模型，采用PrimX表示法和Diffusion Transformer框架，支持从文本或图像输入生成高质量三维资产，适用于游戏、影视、建筑和设计等领域。

立即体验手机扫码

详细介绍

书生·物华2.0（3DTopia 2.0）

书生·物华2.0（3DTopia-XL）：革新三维内容创作的开源工具

书生·物华2.0（3DTopia-XL）是一款由上海人工智能实验室与南洋理工大学等机构联合开发的三维物体生成模型。它采用创新的PrimX表示法和Diffusion Transformer框架，能够高效生成具有物理基础渲染（PBR）特性的高质量三维资产。模型支持从文本或图像输入快速生成三维物体，具有高效率、高质量和精细纹理等特点。3DTopia-XL的代码已开源，并提供免费商用授权，为游戏、影视、建筑和设计等行业的三维内容创作带来革命性的变革。

主要功能：

多模态输入生成三维物体：支持根据文本描述或图像输入快速生成对应的三维模型。
高效率的生成过程：能够在五秒内完成从输入到三维模型的转换，极大提升工作效率。
高质量和精细纹理：生成的三维物体具有平滑的几何形状和空间变化的纹理和材质，满足高标准的视觉需求。
直接应用于游戏引擎和设计软件：生成的三维模型可以直接用于游戏引擎和工业设计软件，方便后续应用。
支持高分辨率几何图形：基于PrimX表示法，能够建模高分辨率的三维几何图形，满足复杂场景的需求。

技术原理：

PrimX表示法：将三维物体的形状、反照率（albedo）、材质信息编码到一个紧凑的张量格式中，实现高效编码和生成。
原始补丁压缩：使用三维变分自编码器（VAE）对每个原语的空间信息进行压缩，得到潜在的原语标记。
潜在原语扩散（Latent Primitive Diffusion）：基于Diffusion Transformer框架，学习如何从随机噪声中逐步去除噪声，生成符合输入条件的潜在原语标记。
可微分渲染：PrimX表示法支持可微分渲染，使模型可以直接从二维图像数据中学习，提升生成质量。

项目地址：