概要 - バランスの乱れ：生成モデルにおけるオンライン概念バランス

タイトル

バランスの乱れ：生成モデルにおけるオンライン概念バランス

時間

2025-07-17 17:59:47

著者

{"Yukai Shi","Jiarong Ou","Rui Chen","Haotian Yang","Jiahao Wang","Xin Tao","Pengfei Wan","Di Zhang","Kun Gai"}

カテゴリ

{cs.CV,cs.AI}

リンク
http://arxiv.org/abs/2507.13345v1

PDF リンク
http://arxiv.org/pdf/2507.13345v1

概要

論文「バランスの崩れ：生成モデルにおけるオンライン概念バランス」は、Yukai Shiらによって書かれ、生成モデルが複雑な概念を効果的に組み合わせる際に直面する課題を調査しています。著者たちは、概念の応答が悪い原因に迫り、これらの問題に対する解決策を提案しています。 **概念構成における課題**： * **概念の欠落**：モデルは入力から期待される概念を多く失っており、不完全または誤解を招く画像に繋がります。 * **属性の漏洩**：モデルは属性を主題に誤って一致させ、生成された内容に一貫性のない部分を引き起こします。 * **概念の連結**：モデルは不合理または nonsensicalなシーンを作り出す方法で概念を組み合わせます。 **原因要因**：著者たちは、概念構成能力に影響を与える要因を分析するための実験を行い、以下のものを含めています： * **モデルのサイズ**：大きなモデルは性能が良くなる傾向がありますが、ある一定の閾値を超えると、さらにサイズを大きくすることの影響は最小限です。 * **データセットの規模**：データセットのサイズを増やすことだけが、必ずしも概念構成能力を向上させるわけではありません。 * **データの分布**：トレーニングデータにおける概念の分布は、非常に重要です。バランスの取れた分布が偏りの学習や悪い概念構成を引き起こすことがあります。 **提案された解決策：IMBA Loss**：データ分布の不均衡を解決するために、著者たちはIMBA（概念ごとの均衡）損失関数を提案しています。この損失関数はトレーニング中に異なる概念の重みを動的に調整し、モデルの理解におけるすべての概念のよりバランスの取れた表現を確保します。 **IMBA Lossの手法**： 1. **IMBA距離**：著者たちはIMBA距離の概念を導入し、データセットにおける概念の頻度比を測定します。この距離はデータ分布を捉え、モデルが概念のよりバランスの取れた表現に向かうように導きます。 2. **トークンごとの再ウェイト**：IMBA損失関数はトークンごとの再ウェイトを適用し、入力テキストの各トークンのIMBA距離に基づいて重みを調整します。これはモデルが少頻度の概念に注意を払い、頻度の高い概念の影響を減らすことを促進します。 3. **オンライントレーニング**：IMBA損失関数はオンラインに設計されており、オフラインのデータセット処理や広範なコード変更が必要ありません。 **評価**：著者たちは、T2I-CompBench、LC-Mis、Inert-CompBenchの3つのベンチマークで提案された手法を評価し、IMBA損失関数で訓練されたモデルとベースライン方法で訓練されたモデルの性能を比較しました。彼らの結果によると、IMBA損失関数は概念構成能力を顕著に向上させ、非常に競争力のある結果を達成しました。 **結論**： IMBA損失関数は、生成モデルにおけるデータ分布の不均衡を解決するための効果的なアプローチです。概念のよりバランスの取れた表現を促進することで、IMBA損失関数は生成モデルが複雑な概念を効果的に組み合わせる能力を向上させ、より現実的で一貫性のある生成された内容を引き起こします。

推奨論文

TrajLens: 複数サンプル探索における細胞発達経路構築のための視覚解析

多様なAIエージェントを通じて自律的な持続可能性評価に向けて

ランダムな(log n)-CNF中で偽の節を検索することは、ランダム通信では難しい

プログラム可能な仮想人間による人間の生理学的な薬物発見への進展

デジタルツインと生成型AIを通じてサイバーセキュリティ教育を可能にする

多目的ポートフォリオ最適化による勾配降下法

認知戦における認証コストの非対称性：複雑性理論的枠組み

UserBench: ユーザーセンタルなエージェントのためのインタラクティブなジム環境

「コードベースのPIRスキーマの安全性について」

各方向同性リメッシュおよび角度間最適化