Resumen - SynC: Refinamiento del Conjunto de Datos de Títulos de Imágenes Sintéticas con Mapeo Uno-a-muchos para la Captura de Títulos de Imágenes a Cero Sesiones

Título
SynC: Refinamiento del Conjunto de Datos de Títulos de Imágenes Sintéticas con Mapeo Uno-a-muchos para la Captura de Títulos de Imágenes a Cero Sesiones

Tiempo
2025-07-24 17:53:26

Autor
{"Si-Woo Kim","MinJu Jeon","Ye-Chan Kim","Soeun Lee","Taewhan Kim","Dong-Jin Kim"}

Categoría
{cs.CV,cs.AI,cs.CL,cs.LG}

Enlace
http://arxiv.org/abs/2507.18616v1

PDF Enlace
http://arxiv.org/pdf/2507.18616v1

Resumen

El documento propone SynC, un nuevo marco para afinar conjuntos de datos de imágenes sintéticas y descripciones para la captioning de imágenes a cero pasos (ZIC). La clave desafío abordado es el desalineamiento semántico entre las imágenes generadas y sus descripciones correspondientes, lo cual puede obstaculizar el entrenamiento del modelo. SynC emplea una estrategia de mapeo uno-a-muchos donde cada descripción recupera múltiples imágenes candidatas del conjunto de imágenes pregenerado. Luego aplica un clasificador de alineamiento inspirado en la consistencia cíclica para seleccionar la mejor imagen verificando su capacidad de recuperar la descripción original a través de la recuperación de texto a imagen. Este enfoque identifica y mantiene pares de imágenes-descripciones bien alineados, mejorando la calidad de los datos de entrenamiento para los modelos de captioning a cero pasos. El documento presenta evaluaciones extensas que demuestran la efectividad de SynC en varios modelos y benchmarks de ZIC, alcanzando resultados de vanguardia en varios escenarios. SynC ofrece una solución práctica para curar datos sintéticos afinados para mejorar el ZIC, abordando los desafíos únicos de la curación de conjuntos de datos sintéticos para el ZIC.


Artículos Recomendados

Sumando caminos de Feynman en tiempo real de polaron de red con estados de producto de matrices

Fenómenos de sobrecalentamiento y fusión de una capa granular vibrada de partículas cúbicas

Pseudorandomness de caminatas de expansores mediante análisis de Fourier en grupos

Relación de Kubo-Martin-Schwinger para los estados propios de energía de sistemas cuánticos de muchos cuerpos simétricos en SU(2)

Representaciones Exactas versus Aproximadas de Funciones Booleanas en la Base de De Morgan

¿Por qué el poder de la energía jet y la formación de estrellas no están correlacionados en las galaxias activas?

La sensibilidad de los detectores de escintilador líquido a la violación de CP con neutrinos atmosféricos

OMiSO: Optimización adaptativa de la estimulación cerebral basada en el estado para modelar los estados de la población neuronal

Surrogados de EDP Multiescala para Predicción y Descalaje: Aplicación a las Corrientes Oceánicas

Nuevas propiedades del inverso generalizado del núcleo-EP ponderado en álgebras de Banach