概要 - CXR-CML:胸部X線画像における長尾多標籤病の零次分類を向上させた

タイトル
CXR-CML:胸部X線画像における長尾多標籤病の零次分類を向上させた

時間
2025-07-25 16:05:47

著者
{"Rajesh Madhipati","Sheethal Bhat","Lukas Buess","Andreas Maier"}

カテゴリ
{cs.CV,cs.AI}

リンク
http://arxiv.org/abs/2507.19398v1

PDF リンク
http://arxiv.org/pdf/2507.19398v1

概要

CXR-CMLは、胸部X線画像(CXR)における長尾多標籤疾患のゼロショット分類を向上させる新しいアプローチです。これは、現在の自己学習ディープラーニングモデルが苦手とするCXRデータセットにおけるクラスの不均衡と稀な疾患の低表示を解決することを目指しています。 CXR-CMLの著者たちは、データセットの潜在空間を効果的にモデル化する既存のCLIPモデルを基に構築しました。しかし、彼らはCLIPの性能が稀少な分布を持つ長尾クラスに対して著しく低下することを発見しました。この問題に対処するために、彼らは潜在空間内のクラスの分布に一致するクラスウェイトングメカニズムを導入しました。 CXR-CMLの主な貢献は以下の通りです: 1. ガウス混合モデル(GMM)とStudent t分布を使用して、潜在分布マニフェストをより効果的にモデル化。 2. クラスタードistributionを利用してメトリックロスを適用し、幅広いカテゴリに対する堅牢な改善を実現。 3. 40の疾患カテゴリ(12の稀な疾患と28の一般的な疾患を含む)に対して5重交差検証を実施して堅牢な評価を行う。 以下はCXR-CML方法の詳細です: 1. **潜在空間のモデル化**: - 著者たちはCLIPから抽出された視覚的言語エンブリーディングに対してGMMを適用し、異なる疾患クラスに対応するクラスタを識別する手助けをします。 - Student t分布を使用してGMMクラスタを精査し、医療データの重尾性を捉え、低表示されたクラスの表現を改善します。 2. **メトリック学習**: - 著者たちはメトリックロス(トリプルロス)を使用して、クラス内のコンパクト性とクラス間の分離を向上させることで、特徴空間をさらに精査します。 - GMMクラスタから生成された仮想ラベルを使用して、メトリックロスのトリプルの選択をガイドします。 3. **テキスト生成**: - 著者たちは事実上のアノテーションとNLP技術を使用して、各クラスに対するテキスト記述を生成します。 - これらのテキスト記述は、トレーニングを強化し、分類性能を向上させるための弱い監督信号として機能します。 4. **評価**: - 著者たちはMIMIC-CXR-JPGデータセット上でCXR-CMLを評価し、このデータセットには234,800枚のCXR画像が39の疾患クラスでラベル付けされています。 - 他の最先端の視覚言語(VL)モデルと比較し、特に稀な疾患に対して優れた結果を達成しました。 著者たちは、CXR-CMLが潜在分布をモデル化し、低表示されたクラスの表現を向上させることで、CXR画像における長尾分類の課題を効果的に解決するという結論に至りました。これは、臨床設定における実際の応用のための有望なアプローチとなります。


推奨論文

任意の欠損モダリティを持つ多様な脳腫瘍セグメンテーションのためのセマンチックガイド付きマスク付き相互学習

MTU: zkSpeedでハイパープロンクを加速するためのマルチ機能ツリーユニット

皮膚組織学的画像から患者の自己報告された人種を予測すること

ACCESS-AV: 智能工場における持続可能な自律走行車の位置特定のための適応型通信-計算コード設計

ランダムな(log n)-CNF中で偽の節を検索することは、ランダム通信では難しい

TrinityDNA:効率的な長序列DNAモデリングのための生物由来の基盤モデル

ChemDFM-R: アトミズド化学知識で強化された化学推論エンジン LLM

メグレズ2 技術報告

公開量子コンピュータ上での非侵襲的測定による時間の順序とLeggett-Garg不平等の検証

多スケールの神経PDEサローグラットの予測とダウンスケーリングへの適用:海流への応用