概要 - ReXGroundingCT:自由テキストレポートからの所見のセグメンテーションのための3D胸部CTデータセット

タイトル
ReXGroundingCT:自由テキストレポートからの所見のセグメンテーションのための3D胸部CTデータセット

時間
2025-07-29 17:27:15

著者
{"Mohammed Baharoon","Luyang Luo","Michael Moritz","Abhinav Kumar","Sung Eun Kim","Xiaoman Zhang","Miao Zhu","Mahmoud Hussain Alabbad","Maha Sbayel Alhazmi","Neel P. Mistry","Kent Ryan Kleinschmidt","Brady Chrisler","Sathvik Suryadevara","Sri Sai Dinesh Jaliparthi","Noah Michael Prudlo","Mark David Marino","Jeremy Palacio","Rithvik Akula","Hong-Yu Zhou","Ibrahim Ethem Hamamci","Scott J. Adams","Hassan Rayhan AlOmaish","Pranav Rajpurkar"}

カテゴリ
{eess.IV,cs.AI,cs.CV}

リンク
http://arxiv.org/abs/2507.22030v1

PDF リンク
http://arxiv.org/pdf/2507.22030v1

概要

ReXGroundingCTは、自由形式の放射線診断所見を3次元胸部CTスキャンのピクセルレベルのセグメンテーションにリンクする最初の公開データセットです。このデータセットは、複雑で具体的なテキストを三次元空間の正確な解剖学的位置に結びつけることで、医療AIの重要なギャップを埋めます。この機能は、根拠のある放射線報告書生成システムにとって不可欠です。 このデータセットは、CT-RATEデータセットからの標準化された放射線診断報告書と、3,142枚の非対照胸部CTスキャンで構成されています。データセットの開発は、以下の3段階の体系的なパイプラインを使用して行われました: 1. **報告書の改訂**:GPT-4が米国の放射線診断の慣習に適した用語とフレーズで標準化された報告書を生成しました。 2. **異常の抽出と分類**:GPT-4o-miniが改訂された報告書から陽性の肺と胸膜炎所見を抽出し、それを12の親カテゴリと61のサブカテゴリに分類しました。 3. **アノテーション**:専門のアノテーターがクラウドベースの医療画像アノテーションプラットフォームを使用して、CTスキャン内の所見を手動でセグメントしました。 データセットには、8,028の所見が16,301のエンティティにわたって含まれており、認定医の放射線医師によって品質管理が行われています。約79%の所見は局所的な異常で、21%は局所性でないです。トレーニングセットには、各所見に対して最大3つの代表セグメントが含まれており、バリデーションセットとテストセットには各所見エンティティに対する完全なラベルが含まれています。 ReXGroundingCTは、胸部CTにおける文レベルの根拠付けと自由形式の医療セグメンテーションモデルの開発と評価のための新しい基準を確立しました。データセットは、https://huggingface.co/datasets/rajpurkarlab/ReXGroundingCTでアクセスできます。 ## ReXGroundingCTの主要な特徴: * **初めて公開されたデータセット**:自由形式の放射線診断所見を胸部CTスキャンの3次元セグメンテーションにリンクします。 * **手動アノテーション**:高品質で信頼性の高いアノテーションを確保します。 * **完全なカバー**:多様な肺と胸膜炎所見を含みます。 * **標準化された報告書**:所見の分析と比較を一貫させることを可能にします。 * **構造化されたパイプライン**:データセットの再現性と信頼性を確保します。 ## ReXGroundingCTの潜在的な応用: * **根拠のある放射線報告書生成**:詳細なテキスト記述と正確な空間位置情報を含む所見の生成。 * **医療画像の解釈**:胸部CTスキャンにおける異常の特定と特徴化を支援。 * **医療研究**:医療画像解析と診断のための新しいAIアルゴリズムの開発を可能にします。 ## 結論: ReXGroundingCTは、医療AIを進めるための価値あるリソースです。自由形式の放射線診断所見を胸部CTスキャンの3次元セグメンテーションにリンクする包括的で信頼性の高いデータセットを提供します。この機能は、医療画像解析と診断の精度、効率、効果を向上させる可能性があります。


推奨論文

PrompTrend:大規模言語モデルのための継続的なコミュニティ主導の脆弱性発見と評価

多様なAIエージェントを通じて自律的な持続可能性評価に向けて

DENSE: 病院訪問を横断する多様な臨床記録の時系列モデリングを用いた長期的な進捗ノート生成

非屏蔽環境で動作するMRIスキャナーに対する電磁干渉を減少させるための主題の接地

SIDA: 合成画像駆動のゼロショットドメイン適応

変形体との接触を検出するための十分かつ必要な接触検出のためのグラフ神経网络的サローグエート

高速計算深熱化

理論間のp-Simuluationを特徴付ける

均一なデジットシリアルモジュラス算術を使用する高性能パイプラインNTTアクセラレータ

「コードベースのPIRスキーマの安全性について」