Résumé - Ultra3D : Génération 3D Efficiente et de Haute Fidélité avec une Partie d'Attention

Titre
Ultra3D : Génération 3D Efficiente et de Haute Fidélité avec une Partie d'Attention

Temps
2025-07-23 17:57:16

Auteur
{"Yiwen Chen","Zhihao Li","Yikai Wang","Hu Zhang","Qin Li","Chi Zhang","Guosheng Lin"}

Catégorie
{cs.CV,cs.AI}

Lien
http://arxiv.org/abs/2507.17745v1

PDF Lien
http://arxiv.org/pdf/2507.17745v1

Résumé

U LTRA 3D est un cadre de génération 3D efficace et de haute qualité conçu pour surmonter les inefficiencies de calcul des méthodes existantes basées sur des voxels rares. Il y parvient en exploitant une pipeline en deux étapes innovante et en introduisant plusieurs innovations clés : **Pipeline en deux étapes** : 1. **Génération de maillage grossier** : Au lieu de prédire directement les coordonnées des voxels rares, U LTRA 3D génère d'abord un maillage grossier en utilisant la représentation compacte VecSet. Cette approche est efficace en termes de calcul et permet de générer des maillages à haute résolution en quelques secondes seulement. 2. **Refinement des voxels rares** : Le maillage grossier est ensuite voxelisé en voxels rares, qui sont ensuite affinés en utilisant un VAE 3D sparse et un DiT avec Part Attention. **Innovations clés** : 1. **Représentation VecSet** : L'utilisation de VecSet permet une génération de maillage grossier efficace, réduisant considérablement le coût de calcul par rapport à la prédiction directe des coordonnées des voxels rares. 2. **Part Attention** : Ce mécanisme d'attention localisée restreint les calculs d'attention aux régions de parties sémantiquement cohérentes, préservant la continuité structurale et atteignant une accélération de 6,7× dans la génération latente sans compromettre la qualité. 3. **Pipeline d'annotation de parties à l'échelle** : Ce pipeline convertit efficacement des maillages bruts en voxels rares étiquetés par parties, permettant des annotations de haute qualité à l'échelle. **Avantages** : - **Haute efficacité** : U LTRA 3D réduit considérablement le coût de calcul par rapport aux méthodes existantes, permettant la génération de modèles 3D à haute résolution en une fraction du temps. - **Haute qualité** : La combinaison de VecSet et Part Attention assure une haute fidélité visuelle et une précision géométrique. - **Échelle** : Le pipeline d'annotation de parties à l'échelle permet une annotation efficace de grandes collections de données. **Applications** : U LTRA 3D a le potentiel de révolutionner diverses applications, y compris : - **Modélisation 3D** : Génération efficace de modèles 3D à haute résolution pour usage dans les jeux vidéo, la réalité virtuelle et d'autres industries. - **Conception** : Permet aux concepteurs de créer et de modifier rapidement des modèles 3D. - **Éducation** : Fournit aux étudiants un outil pour visualiser des concepts 3D complexes. En résumé, U LTRA 3D représente une avancée significative dans le domaine de la génération 3D, offrant une solution plus efficace et de haute qualité pour créer des modèles 3D.


Articles Recommandés

Modèle de Mumford-Shah régularisé par la variation totale généralisée relaxée et piecewise smooth pour la segmentation de surfaces triangulées

Perte asymétrique conjointe pour l'apprentissage avec des étiquettes bruitées

Complexes simpliciaux déterministes

Étude comparative des capacités physiques d'un argon liquide et d'un scintillateur liquide à base d'eau au DUNE

Tri à l'horloge : Un nouvel algorithme de tri parallèle et son implémentation

Rubriques comme récompenses : Apprentissage par renforcement au-delà des domaines vérifiables

BetterCheck : Vers la protection des VLM pour les systèmes de perception automobile

Chaque opérateur $m$-concave expansif admet une dilatation $m$-isométrique.

Un nouveau coefficient pour mesurer l'accord entre des variables continues

Surrogats de Réseaux de Neurones Graphiques pour le Contact avec des Corps Déformables avec Détection de Contact Nécessaire et Sufficient