概要 - HairCUP: 3D高斯アバターの髪の構成ユニバーサル事前情報

タイトル

HairCUP: 3D高斯アバターの髪の構成ユニバーサル事前情報

時間

2025-07-25 17:59:53

著者

{"Byungjun Kim","Shunsuke Saito","Giljoo Nam","Tomas Simon","Jason Saragih","Hanbyul Joo","Junxuan Li"}

カテゴリ

{cs.CV}

リンク
http://arxiv.org/abs/2507.19481v1

PDF リンク
http://arxiv.org/pdf/2507.19481v1

概要

この論文では、毛髪の移行とカスタマイズを可能にする革新的な3DアバターモデルであるHairCUPを提案します。顔と毛を一つの実体として扱う既存の方法とは異なり、HairCUPは明示的に分離してモデル化し、自然なヘアスタイルの変換を可能にします。 **HairCUPの主要な機能**： * **構成モデル**：HairCUPは顔と毛を独立したコンポーネントに分離し、独立した制御と操作を可能にします。これにより、アバターベetween間のヘアスタイルの移行が可能となり、追加の最適化や不自然なアーティファクトの導入が不要です。 * **合成データ生成**：毛と無毛の画像のペアデータセットの不足を解消するために、HairCUPはdiffusion priorを使用して合成の無毛データを生成します。これにより、モデルは顔と毛の分離した表現を学習し、現実世界のデータに依存することなく行います。 * **ユニバーサル先験モデル**：HairCUPはユニバーサル先験モデルとして設計されており、新しい被験者に対して高精度で最小のトレーニングデータでパーソナライズされたアバターグenerationを生成できます。 * **リライト可能なアバター**：HairCUPはリライト可能な3Dガウスアバターレresentationを使用し、異なる照明条件下でも一貫した外観を維持するアバターレンダリングを可能にします。 **手法**： 1. **合成無毛画像生成**：HairCUPはスタジオ撮影データセットから合成の無毛画像を生成するためにdiffusion priorを使用します。これは、各被験者に対して無毛メッシュを登録し、diffusionモデルを使用して被覆された頭皮領域を塗りつぶすプロセスです。 2. **構成3D先験モデル**：モデルは顔と毛に対して別々のエンコーダとデコーダを持ち、エンコーダは顔の表情や毛の動きの潜在表現を学習し、デコーダはこれらの表現に基づいて3Dガウスを生成します。 3. **トレーニング**：HairCUPは多視点ビデオキャプチャと既知のポイントライトパターンを使用してトレーニングされます。トレーニング損失には、再構成損失、セグメンテーション損失、正則化損失、KL散布損失が含まれます。 4. **微調整**：HairCUPは最小のトレーニングデータで新しい被験者に対して微調整が可能です。これは、デコーダのバイアスマップを生成するためのハイパーネットワークを更新するプロセスです。 **応用**： * **ヘアスタイルの移行**：HairCUPはアバターベetween間のヘアスタイルの移行を可能にし、ユーザーは追加の最適化なしでさまざまなヘアスタイルを探ることができます。 * **パーソナライズされたアバター**：HairCUPは高精度で最小のトレーニングデータで新しい被験者に対してパーソナライズされたアバターグenerationを生成できます。 * **リライト可能なアバター**：HairCUPは異なる照明条件下でも一貫した外観を維持するアバターレンダリングを可能にします。 **利点**： * **リアリズム**：HairCUPは非常にリアルな3Dアバターや自然なヘアスタイルの変換を生成します。 * **柔軟性**：HairCUPは柔軟なヘアスタイルの移行とカスタマイズを可能にします。 * **効率**：HairCUPは最小のトレーニングデータを必要とし、迅速に微調整が可能です。 * **スケーラビリティ**：HairCUPはバーチャルリアリティ、ゲーム、エンターテインメントなど、幅広いアプリケーションに適用できます。 **結論**： HairCUPは3Dアバターゲネレーションの大きな進歩を代表しています。顔と毛を独立したコンポーネントとしてモデル化することで、HairCUPはスムーズなヘアスタイルの移行、パーソナライズされたアバターやリライト可能なアバターグenerationを可能にします。この技術は、3Dアバターやインタラクションの作成方法を革新する可能性があります。

推奨論文

DINO-SLAM：神経学的な暗黙的および明示的な表現のためのDINO情報を利用したRGB-D SLAM

ダブル・ダーティー：同時的なLUTとアンダラー・チェーンの使用を可能にするFPGAアーキテクチャ

非構造データからのパーソナライズされた治療効果推定

室温での宏观非局所電圧と流体力学電子流の観測

MMBench-GUI: グラフィカルユーザインターフェースエージェントのための階層的多プラットフォーム評価フレームワーク

「大規模言語モデルを使用して、社会生態系における複数の人間の視点をシミュレートする」

PurpCode: より安全なコード生成のための推論

CXR-CML：胸部X線画像における長尾多標籤病の零次分類を向上させた

言語混合がバイリンガルLLMの推論に与える影響

量子回路暗号化に基づく暗号化状態量子コンパイルスキーム