Zusammenfassung - Multizentrische Validierung eines Deep-Learning-Modells zur Skoliosenbewertung

Titel

Multizentrische Validierung eines Deep-Learning-Modells zur Skoliosenbewertung

Zeit

2025-07-18 17:21:53

Autor

{"Šimon Kubov","Simon Klíčník","Jakub Dandár","Zdeněk Straka","Karolína Kvaková","Daniel Kvak"}

Kategorie

{cs.CV,cs.AI,cs.LG}

Link
http://arxiv.org/abs/2507.14093v1

PDF Link
http://arxiv.org/pdf/2507.14093v1

Zusammenfassung

Diese Forschungsarbeit untersucht die Effektivität eines tiefen Lernmodells zur Bewertung der Kyphose, einer Erkrankung, die durch eine abnormale Krümmung der Wirbelsäule gekennzeichnet ist. Das Ziel der Studie bestand darin zu ermitteln, ob das künstliche Intelligenz-Modell Cobb-Winkel-Messungen und Schweregradklassifikationen erzeugen kann, die denen von Spezialröntgenärzten entsprechen. Die Forschung umfasste eine mehrzentrische Validierungsstudie mit 103 stehenden Anteroposterior-Röntgenaufnahmen der gesamten Wirbelsäule, die aus zehn Krankenhäusern gesammelt wurden. Zwei muskuloskelettale Röntgenärzte haben jede Studie unabhängig gemessen und als Referenzleser gedient. Anschließend wurde das künstliche Intelligenz-Modell mit verschiedenen Metriken, einschließlich Bland-Altman-Analyse, mittlerem absoluten Fehler (MAE), quadrierter mittlerer Fehler (RMSE), Pearson-Korrelationskoeffizienten und Cohen's κ für die vierstufige Schweregradklassifikation, mit diesen Messungen verglichen. Das künstliche Intelligenz-Modell erzielte einen MAE von 3.89° (RMSE 4.77°) im Vergleich zu Röntgenärztin 1 und einen MAE von 3.90° (RMSE 5.68°) im Vergleich zu Röntgenärztin 2. Die Pearson-Korrelationskoeffizienten betragenten r = 0.906 und r = 0.880 (zwischen-Leser r = 0.928), während Cohen's κ für die Schweregradklassifikation 0.51 und 0.64 (zwischen-Leser κ = 0.59) erreichte. Diese Ergebnisse zeigen, dass das vorgeschlagene Softwareprogramm Cobb-Winkel-Messungen und Schweregradklassifikationen erzeugen kann, die denen von Expertröntgenärzten in mehreren Zentren vergleichbar sind. Die Studie schließt, dass die künstliche Intelligenz-Software das Schulterreporting und die Triage in klinischen Abläufen potenziell vereinfachen und verbessern kann, was die Effizienz und Konsistenz erhöhen könnte. Allerdings ist weiteres Forschungsbedarf erforderlich, um den Einfluss der Integration von KI auf die klinische Entscheidungsfindung und die Effizienz der Abläufe zu bewerten.

Empfohlene Papiere

In Richtung konservativer Inferenz in Glaubwürdigkeitsnetzwerken mittels Glaubwürdigkeitsfunktionen: der Fall von Glaubwürdigkeitsketten

Muonium als Probe von Punktlücken in Typ-Ib-Diamant

Simulierung mehrerer menschlicher Perspektiven in gesellschaftlich-ökologischen Systemen mithilfe großer Sprachmodelle

Plattform zur Repräsentation und Integration mehrmodaler molekularer Eintauchungen

Anwendung neuer konformer Kühlgeometrien auf das grüne Spritzgießen komplexer schlanker polymerer Teile mit hohen Dimensionsspezifikationen

Starke Sparsifikation für 1-in-3-SAT durch Polynom-Freiman-Ruzsa

ReCatcher: hin zu Regressionstests für Code-Generierung mit Large Language Models (LLMs)

Benchmarks zur Vorhersage der Sterblichkeitsrate auf Wartelisten bei Herztransplantationen über die Zeit bis zum Ereignis durch die Nutzung neuer longitudinaler UNOS-Datensätze

Detecting Galactic Rings in the DESI Legacy Imaging Surveys with Semi-Supervised Deep Learning Erkennung von galaktischen Ringen in den DESI Legacy Imaging Surveys mit semiautonomen tiefem Lernen

Ein neuer Ansatz zur Klassifizierung von Monoaminen Neurotransmittern durch Anwendung von Maschinellem Lernen auf UV plasmonisch gestalteten Auto-Fluoreszenz-Zeitverfall-Serien (AFTDS)