概要 - データ制約の環境で、拡散が自己回帰を上回る

タイトル
データ制約の環境で、拡散が自己回帰を上回る

時間
2025-07-21 17:59:57

著者
{"Mihir Prabhudesai","Menging Wu","Amir Zadeh","Katerina Fragkiadaki","Deepak Pathak"}

カテゴリ
{cs.LG,cs.AI,cs.CV,cs.RO}

リンク
http://arxiv.org/abs/2507.15857v1

PDF リンク
http://arxiv.org/pdf/2507.15857v1

概要

論文「Diffusion Beats Autoregressive in Data-Constrained Settings」は、データが制約されている環境でマスクディフュージョンモデルと自己回帰(AR)モデルの性能を比較しています。制約されたデータがトレーニングに繰り返し使用される環境において、以下の要約が提供されています。 **主要な発見**: * **データが少ない場合でも、計算リソースが豊富な場合、ディフュージョンモデルはARモデルを上回る**:この利点は、ディフュージョンモデルが繰り返しデータをよりよく利用できる能力に帰されるもので、バリデーションロスの低下とダウンストリームタスクにおける優れた性能を導きます。 * **ディフュージョンモデルは繰り返しデータからより多くの利点を得る**:ディフュージョンモデルは、最大100エポックまで繰り返しデータでトレーニングすることができ、繰り返しデータは新鮮なデータとほぼ同じ効果を持つ一方で、ARモデルは新鮮なデータで最大4エポック必要です。 * **ディフュージョンモデルは効率的なエポック数が高い**:ディフュージョンモデルは、主要な劣化が少ないように繰り返しデータをより多くのエポックで利用することができ、ARモデルの15に対して約500エポックの効果的な減衰率があります。 * **ディフュージョンモデルがARモデルを上回る計算リソースの鍵ポイントはデータセットのサイズに応じてパワーレーションを従う**:これにより、ディフュージョンが特定のデータセットのサイズに対して最適なモデル選択となる時期を予測する閉形式の表現が可能です。 * **ディフュージョンモデルはダウンストリーム性能が向上する**:データが制約されている環境でトレーニングされた最も優れたディフュージョンモデルは、様々なダウンストリーム言語タスクにおいて最も優れたARモデルを常に上回ります。 **説明**: * **ディフュージョンモデルのランダムマスク**:ディフュージョンモデルの主要な利点は、トレーニング中にランダムマスクを使用することにあります。これはデータ拡張の形であり、モデルが多様なトークンの順序や予測タスクにさらされることで、より良い一般化と各トレーニング例のより効果的な利用を促進します。 * **ARモデルの計算効率**:ARモデルは固定された左から右への因子分解と更新ごとに強い監督を持つため、より計算効率的です。しかし、これはデータ効率が低いという代償もあります。 **結論**: この論文は、ARモデルが一般的に優れているという伝統的な考え方に挑戦し、データが計算リソースよりもボトルネックになる場合、ディフュージョンモデルが魅力的な代替案であることを強調しています。この発見は、データが少ない大規模言語モデルや他のシーケンスモデルアプリケーションの開発において重要な意味を持っています。 **追加ポイント**: * この論文はマスクディフュージョンモデルとARモデルに焦点を当てていますが、この発見は他のディフュージョンベースのモデルにも適用される可能性があります。 * この論文は、深層学習モデルをスケーリングする際のデータ効率の重要性を強調しており、高品質なデータがますます少なくなる中で特に重要です。 * この論文は、データが制約されている環境でディフュージョンモデルをARモデルに優先することを提唱する、実務家にとって非常に有益な洞察を提供しています。


推奨論文

非交差数の一般の厳しい制限(境界交差点数に対して厳しい)

MMBench-GUI: グラフィカルユーザインターフェースエージェントのための階層的多プラットフォーム評価フレームワーク

SeC: 渐進的な概念構築を通じて複雑なビデオオブジェクトセグメンテーションを推進する

表面におけるTutteの重心埋め込みの離散的な類似物

全関数ポリノム階層における向下的自己還元性

禁止パターンと植えられた色を持つエッジ色付け問題

UI-AGILE:効果的な強化学習と正確な推論時の根拠化によるGUIエージェントの進化

薄膜におけるランダムプラズマ照射下の双峰分布の正確な解

「真空圧縮強化微メートル尺度蒸気セル磁力計」

特徴に戻ってみましょう:ビデオワールドモデルのためのDINO基盤