当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > TripoSF—VASTAI新一代开源3D模型发布

TripoSF—VASTAI新一代开源3D模型发布

2025-03-31 23:17:13 0浏览收藏

VAST AI发布全新开源3D基础模型TripoSF，该模型采用SparseFlex表示法和稀疏体素结构，显著降低内存占用，支持更高分辨率的训练和推理。TripoSF在细节捕捉、拓扑结构支持和计算效率方面均有突破，Chamfer Distance降低约82%，F-score提升约88%。其视锥体感知的分区体素训练策略进一步提升了训练效率，支持1024³高分辨率建模。TripoSF适用于视觉特效、游戏开发、具身智能和产品设计等领域，为3D建模带来革命性提升。项目已开源，可在Github、HuggingFace和arXiv上获取更多信息。

TripoSF：VAST推出的革命性3D基础模型

TripoSF是VAST公司最新研发的3D基础模型，它克服了传统3D建模在细节精度、复杂结构处理和可扩展性方面的局限。通过采用SparseFlex表示法和稀疏体素结构，TripoSF仅在物体表面附近区域存储和计算体素信息，显著降低内存占用，从而支持更高分辨率的训练和推理。此外，它还创新性地引入了“视锥体感知的分区体素训练”策略，进一步提升了训练效率。在多个基准测试中，TripoSF表现出色，Chamfer Distance降低约82%，F-score提升约88%。

TripoSF— VAST AI 开源的新一代 3D 基础模型

TripoSF核心功能：

卓越的细节捕捉能力: TripoSF能够捕捉极其精细的表面细节和微观结构，在标准基准测试中，Chamfer Distance降低约82%，F-score提升约88%。
强大的拓扑结构支持: TripoSF原生支持任意拓扑结构，能够轻松处理开放表面和内部结构复杂的物体，例如布料和树叶等。
高效的计算资源利用: 稀疏体素结构大幅降低了内存需求，使TripoSF在高分辨率建模中更加高效，减少对计算资源的依赖。
实时渲染能力: 视锥体感知训练策略使TripoSF能够在动态和复杂环境中更好地适应，并通过渲染损失进行端到端训练，避免了数据转换过程中的细节损失。
高分辨率建模能力: TripoSF支持在1024³高分辨率下进行训练和推理，生成更精细、更逼真的3D模型。

TripoSF技术原理详解：

SparseFlex表示法: TripoSF的核心是SparseFlex表示法，它借鉴了NVIDIA Flexicubes的优势，并结合了稀疏体素结构。与传统的稠密网格不同，它只在物体表面附近存储和计算体素数据，极大减少了内存占用，从而支持高分辨率建模并原生支持任意拓扑结构。
视锥体感知的分区体素训练策略: 该策略源于实时渲染中的视锥体剔除技术，在每次训练迭代中，只激活和处理位于相机视锥体内的SparseFlex体素，从而显著降低训练成本，实现高分辨率下的高效训练。
TripoSF变分自编码器(VAE): 基于SparseFlex表示法和高效的训练策略，VAST构建了TripoSF VAE，形成了一套完整的、高效的处理流程，从输入、编码、解码到输出，显著提升了3D模型重建和生成的效率。

资源链接：