Zusammenfassung - Multizentrische Validierung eines Deep-Learning-Modells zur Skoliosenbewertung
Titel
Multizentrische Validierung eines Deep-Learning-Modells zur Skoliosenbewertung
Zeit
2025-07-18 17:21:53
Autor
{"Šimon Kubov","Simon Klíčník","Jakub Dandár","Zdeněk Straka","Karolína Kvaková","Daniel Kvak"}
Kategorie
{cs.CV,cs.AI,cs.LG}
Link
http://arxiv.org/abs/2507.14093v1
PDF Link
http://arxiv.org/pdf/2507.14093v1
Zusammenfassung
Diese Forschungsarbeit untersucht die Effektivität eines tiefen Lernmodells zur Bewertung der Kyphose, einer Erkrankung, die durch eine abnormale Krümmung der Wirbelsäule gekennzeichnet ist. Das Ziel der Studie bestand darin zu ermitteln, ob das künstliche Intelligenz-Modell Cobb-Winkel-Messungen und Schweregradklassifikationen erzeugen kann, die denen von Spezialröntgenärzten entsprechen.
Die Forschung umfasste eine mehrzentrische Validierungsstudie mit 103 stehenden Anteroposterior-Röntgenaufnahmen der gesamten Wirbelsäule, die aus zehn Krankenhäusern gesammelt wurden. Zwei muskuloskelettale Röntgenärzte haben jede Studie unabhängig gemessen und als Referenzleser gedient. Anschließend wurde das künstliche Intelligenz-Modell mit verschiedenen Metriken, einschließlich Bland-Altman-Analyse, mittlerem absoluten Fehler (MAE), quadrierter mittlerer Fehler (RMSE), Pearson-Korrelationskoeffizienten und Cohen's κ für die vierstufige Schweregradklassifikation, mit diesen Messungen verglichen.
Das künstliche Intelligenz-Modell erzielte einen MAE von 3.89° (RMSE 4.77°) im Vergleich zu Röntgenärztin 1 und einen MAE von 3.90° (RMSE 5.68°) im Vergleich zu Röntgenärztin 2. Die Pearson-Korrelationskoeffizienten betragenten r = 0.906 und r = 0.880 (zwischen-Leser r = 0.928), während Cohen's κ für die Schweregradklassifikation 0.51 und 0.64 (zwischen-Leser κ = 0.59) erreichte. Diese Ergebnisse zeigen, dass das vorgeschlagene Softwareprogramm Cobb-Winkel-Messungen und Schweregradklassifikationen erzeugen kann, die denen von Expertröntgenärzten in mehreren Zentren vergleichbar sind.
Die Studie schließt, dass die künstliche Intelligenz-Software das Schulterreporting und die Triage in klinischen Abläufen potenziell vereinfachen und verbessern kann, was die Effizienz und Konsistenz erhöhen könnte. Allerdings ist weiteres Forschungsbedarf erforderlich, um den Einfluss der Integration von KI auf die klinische Entscheidungsfindung und die Effizienz der Abläufe zu bewerten.
Empfohlene Papiere
In Richtung konservativer Inferenz in Glaubwürdigkeitsnetzwerken mittels Glaubwürdigkeitsfunktionen: der Fall von Glaubwürdigkeitsketten
Muonium als Probe von Punktlücken in Typ-Ib-Diamant
Simulierung mehrerer menschlicher Perspektiven in gesellschaftlich-ökologischen Systemen mithilfe großer Sprachmodelle
Plattform zur Repräsentation und Integration mehrmodaler molekularer Eintauchungen
Anwendung neuer konformer Kühlgeometrien auf das grüne Spritzgießen komplexer schlanker polymerer Teile mit hohen Dimensionsspezifikationen
Starke Sparsifikation für 1-in-3-SAT durch Polynom-Freiman-Ruzsa
ReCatcher: hin zu Regressionstests für Code-Generierung mit Large Language Models (LLMs)
Benchmarks zur Vorhersage der Sterblichkeitsrate auf Wartelisten bei Herztransplantationen über die Zeit bis zum Ereignis durch die Nutzung neuer longitudinaler UNOS-Datensätze
Detecting Galactic Rings in the DESI Legacy Imaging Surveys with Semi-Supervised Deep Learning
Erkennung von galaktischen Ringen in den DESI Legacy Imaging Surveys mit semiautonomen tiefem Lernen
Ein neuer Ansatz zur Klassifizierung von Monoaminen Neurotransmittern durch Anwendung von Maschinellem Lernen auf UV plasmonisch gestalteten Auto-Fluoreszenz-Zeitverfall-Serien (AFTDS)