概要 - 生成AI駆動の高精度人間動作シミュレーション
タイトル
生成AI駆動の高精度人間動作シミュレーション
時間
2025-07-18 17:24:50
著者
{"Hari Iyer","Neel Macwan","Atharva Jitendra Hude","Heejin Jeong","Shenghan Guo"}
カテゴリ
{cs.AI,cs.CV}
リンク
http://arxiv.org/abs/2507.14097v1
PDF リンク
http://arxiv.org/pdf/2507.14097v1
概要
この論文では、生成型AIを使用した高精度な人間動作シミュレーションの新しいフレームワークであるG-AI-HMSを提案します。このフレームワークは、大規模言語モデル(LLM)のChatGPTを前処理およびタスクプロンプトの標準化に統合し、MotionGPTを使用してリアルな人間の動作シーケンスを生成することで、既存のテキストから動作モデルの限界に対応します。 G-AI-HMSの主要な構成要素は以下の通りです: * **LLMベースのガイド生成**:ChatGPTを使用して、HumanML3Dデータセットのキーワードを使用してフリー形式のタスク記述を構造化されたガイドプロンプトに変換し、モデルのトレーニング分布に一致する入力言語を確保します。 * **MotionGPTを使用した動作合成**:精査されたプロンプトを使用して、MotionGPTを使用して対応する3D動作シミュレーションを生成します。MotionGPTは、VQ-VAEトークナイザーとT5ベースの言語モデルを使用して、自然言語プロンプトを動作シーケンスに変換します。 * **評価フレームワーク**:生成された動作シーケンスは、MediaPipeを使用してポーズ推定およびMPJPE、PA-MPJPE、DTWなどのメトリクスを使用して、空間精度、一致性和時系列の一貫性を評価するために、参照人間データと比較されます。 この研究は、G-AI-HMSの効果を8つの多様な物理タスクで示し、AI強化されたプロンプトが、特に大運動パターンや繰り返し動作を含むタスクで、人間の記述と比較して同等またはより高い精度の動作出力を生成できることを示しました。しかし、人間のプロンプトは、遠位関節の詳細な関節や複雑な遷移の細分化において優位性を示しました。 以下の貢献が強調されています: * 既存のT2Mモデルにおけるプロンプトの多様性と分布外の一般化の限界の特定と、AI強化されたガイドを通じてこれらの問題に対処。 * LLMベースのガイド生成とT2Mベースの動作合成の統合により、動作品質を向上。 * 聯邦評価フレームワークの導入により、標準化されたメトリクスを使用してAI強化された動作シーケンスと人間の参照データを比較。 * 提案されたG-AI-HMSフレームワークの多様なタスク領域への適応性の示唆。 * プロンプトの単語群が動作モデルのトレーニング分布に一致する重要性の強調と、ほとんどのシナリオでAI強化されたプロンプトが人間の記述を上回ることを証明。 今後の研究は、多様な多モーダル微調整戦略の探索、人間のフィードバックを取り入れたAI強化されたプロンプトの統合、タスクの多様性の拡張を通じて、トレーニング、シミュレーションおよびインタラクティブ環境における一般化と適用性を向上させることを含みます。
推奨論文
ゴーデマン--ジャケット L-関数と同調テタリフト
多源CTスキャン分類におけるドメインシフトの抑え込みを目的とする入力空間標準化
半ストリーミング単一ソース最短経路のためのより良い境界
高次元仕様を持つ複雑な細長いポリマー部品のグリーンインジェクション成形に新しい形状冷却配置の適用
Mix-Geneformer: 人間とマウスのscRNA-seqデータのための統一表現学習
自然言語プロンプトから生成されたLLMコードの形式確認への進展
サイエンスが危機に直面している:データ操作と誤情報の時代における長期の生態学的および進化研究に対する組織的なサポートの緊急な必要性
紫外線プラズモニック技術で構成された自動蛍光減衰シリーズ(AFTDS)に機械学習を適用することでモノアミン神経伝達物質を分類する新しいアプローチ
特徴なし回帰クリージング
原始初期化を通じての非協力宇宙船3Dモデルの高速学習