概要 - オランダの臨床自由テキスト文書における有害薬物反応の検出:Transformerモデルを用いた基準研究

タイトル
オランダの臨床自由テキスト文書における有害薬物反応の検出:Transformerモデルを用いた基準研究

時間
2025-07-25 16:02:02

著者
{"Rachel M. Murphy","Nishant Mishra","Nicolette F. de Keizer","Dave A. Dongelmans","Kitty J. Jager","Ameen Abu-Hanna","Joanna E. Klopotowska","Iacer Calixto"}

カテゴリ
{cs.CL}

リンク
http://arxiv.org/abs/2507.19396v1

PDF リンク
http://arxiv.org/pdf/2507.19396v1

概要

この基準研究は、トランスフォーマーモデルを使用してオランダの臨床自由テキスト文書における有害薬物反応(ADE)の検出を調査しています。この研究は、オランダの臨床テキストにおけるADE検出のための基準を確立し、いくつかのトランスフォーマーモデルの中で最も優れたモデルを特定することを目的としています。 研究は3つのデータセットを使用しています:オランダADEコーパス、ICU AKIコーパス、WINGSコーパス。オランダADEコーパスには、ADEアノテーションのある102件の匿名化された臨床進捗記録が含まれており、ICU AKIコーパスにはADEを含むまたは含まないICU患者記録が含まれており、WINGSコーパスにはADEアノテーションのある退院状が含まれています。 研究は、BERTje、RobBERT、MedRoBERTa.nl、NuNERの4つのトランスフォーマーモデルを比較しています。モデルはオランダADEコーパスで訓練され、他の2つのデータセットを使用して評価されています。評価の指標には、ミクロおよびマクロ平均F1スコア、精度、再現率、特異性が含まれています。 結果は、MedRoBERTa.nlが全体で最も優秀であり、金標準を使用したマクロ平均F1スコアが0.63であり、予測エンティティを使用した場合も0.62であることを示しています。研究は、不均衡データセットに対して適切な性能指標を使用する重要性も強調しています。特に、再現率により多くの重みを置くF2スコアが適切であると述べています。 以下のいくつかの重要な洞察が研究から得られます: * トランスフォーマーモデルはオランダの臨床テキストにおけるADE検出において、Bi-LSTMモデルを上回ります。 * MedRoBERTa.nlはオランダの臨床テキストにおけるADE検出における最も優れたモデルです。 * F2スコアは、ADE検出のような不均衡データセットに対するより適切な性能指標です。 * 外部評価は、NLPモデルの一般化能力を評価するために不可欠です。 この研究の発見は、オランダの臨床テキストにおけるADE検出のためのNLPモデルの開発と展開に役立つとともに、医療環境における薬物安全性の向上に寄与することができます。


推奨論文

メグレズ2 技術報告

紫外線プラズモニック技術で構成された自動蛍光減衰シリーズ(AFTDS)に機械学習を適用することでモノアミン神経伝達物質を分類する新しいアプローチ

OMiSO: 神経集合状態を形成するための状態依存脳刺激の適応的最適化

色度メトリック対のGromov-Hausdorff距離と六パックの安定性

クラウドにおけるHSMおよびTPMセキュリティの再考:現実の攻撃と次世代の防御策

RealBench:リアルワールドIPデザインを使用したVerilog生成モデルのベンチマーク評価

SIDA: 合成画像駆動のゼロショットドメイン適応

無限群の隠れた部分群問題

ハードラベル攻撃におけるトランスファーベースの事前知識を用いたレイサーチ手順の強化

RoadBench:道路損傷理解のためのビジョン言語基盤モデルとベンチマーク