Resumen - CXR-CML: Mejora de la clasificación cero-eshote de enfermedades de etiqueta múltiple de cola larga en Rayos X de tórax
Título
CXR-CML: Mejora de la clasificación cero-eshote de enfermedades de etiqueta múltiple de cola larga en Rayos X de tórax
Tiempo
2025-07-25 16:05:47
Autor
{"Rajesh Madhipati","Sheethal Bhat","Lukas Buess","Andreas Maier"}
Categoría
{cs.CV,cs.AI}
Enlace
http://arxiv.org/abs/2507.19398v1
PDF Enlace
http://arxiv.org/pdf/2507.19398v1
Resumen
CXR-CML es un nuevo enfoque para mejorar la clasificación a cero pasos de enfermedades de cola larga en imágenes de radiografías de tórax (CXR). Tiene como objetivo abordar los desafíos de desequilibrio de clases y subrepresentación de enfermedades raras en los conjuntos de datos de CXR, con los que luchan actualmente los modelos de aprendizaje profundo supervisados por sí mismos.
Los autores de CXR-CML se basan en el modelo CLIP existente, que efectivamente modela el espacio latente del conjunto de datos. Sin embargo, encontraron que el rendimiento de CLIP se degrade significativamente para clases de cola larga con una distribución dispersa. Para abordar este problema, introducen un mecanismo de ponderación de clases que se alinea con la distribución de clases dentro del espacio latente.
Las contribuciones principales de CXR-CML son:
1. Modelar el manifold de distribución latente de manera más efectiva utilizando el Modelo de mezcla de Gaussianos (GMM) y la distribución t de Student.
2. Aprovechar la distribución agrupada para aplicar una pérdida métrica, lo que resulta en una mejora robusta en una amplia gama de categorías.
3. Realizar una evaluación robusta utilizando validación cruzada de 5 veces en un conjunto diverso de 40 categorías de enfermedades, incluyendo 12 clases raras y 28 comunes.
Aquí hay un desglose del método CXR-CML:
1. **Modelado del espacio latente**:
- Los autores aplican GMM a los embeddings visuales-lenguaje extraídos por CLIP, lo que ayuda a identificar clusters que corresponden a diferentes clases de enfermedades.
- La distribución t de Student se utiliza para afinar los clusters de GMM, capturando la naturaleza de cola larga de los datos médicos y mejorando la representación de clases subrepresentadas.
2. **Aprendizaje métrico**:
- Los autores utilizan una pérdida métrica (pérdida triple) para afinar el espacio de características mediante la mejora de la compactitud intraclase y la separación interclase.
- Se utilizan pseudoetiquetas generadas por la agrupación de GMM para guiar la selección de tríos para la pérdida métrica.
3. **Generación de texto**:
- Los autores generan descripciones textuales para cada clase utilizando las anotaciones de verdad y técnicas de procesamiento del lenguaje natural (NLP).
- Estas descripciones textuales actúan como señales supervisivas débiles para mejorar el entrenamiento y mejorar el rendimiento de la clasificación.
4. **Evaluación**:
- Los autores evalúan CXR-CML en el conjunto de datos MIMIC-CXR-JPG, que contiene 234,800 imágenes de CXR etiquetadas con 39 clases de enfermedades.
- Comparan el rendimiento de CXR-CML con otros modelos de visión-lenguaje (VL) de vanguardia (SOTA) y alcanzan resultados superiores, especialmente para enfermedades raras.
Los autores concluyen que CXR-CML efectivamente aborda los desafíos de clasificación de cola larga en imágenes de CXR mediante el modelado de la distribución latente y la mejora de la representación de clases subrepresentadas. Esto lo hace una aproximación prometedora para aplicaciones prácticas en entornos clínicos.
Artículos Recomendados
Transición desde la superconductividad de banda plana a la superconductividad convencional
Un modelo semi-analítico para los efectos de las perturbaciones de grano de materia oscura borrosa en el movimiento orbital
Asignación de pilotos asistida por una Red Neuronal Convolucional Cuántica Híbrida en Sistemas de MIMO Masivo sin Célula
Cuantificando el ROI de la Inteligencia de Amenazas Cibernéticas: Un Enfoque Basado en Datos
Computación neuromorfológica: Un Marco Teórico para la Escalabilidad en Tiempo, Espacio y Energía
Estimación de Frecuencia de Datos Multietapa Correlacionados bajo Privacidad Diferencial Local
Efectos de marea en ondas gravitacionales y escalar y flujos a un orden post-Newtoniano en teorías tensor-scalar masivas
Simulación de Interacciones Binarias-Únicas en Discos de AGN II: Probabilidad de Fusión de Pares de Hielos Negros durante el Proceso Terciario Caótico
Las estrellas de referencia de alta velocidad radial de Gaia RVS. III. Estrellas de alta velocidad radial confirmadas y nuevas de Gaia DR3.
Cascada de energía universal y relajación en la turbulencia magnohidrodinámica inercial tridimensional de electrones universales