Resumen - Dejarlo ir? No exactamente: Abordando el problema de "cold start" en recomendaciones secuenciales con inicialización basada en contenido

Título
Dejarlo ir? No exactamente: Abordando el problema de "cold start" en recomendaciones secuenciales con inicialización basada en contenido

Tiempo
2025-07-25 17:57:31

Autor
{"Anton Pembek","Artem Fatkulin","Anton Klenitskiy","Alexey Vasilev"}

Categoría
{cs.IR,cs.AI,cs.LG}

Enlace
http://arxiv.org/abs/2507.19473v1

PDF Enlace
http://arxiv.org/pdf/2507.19473v1

Resumen

Este documento aborda el problema del arranque en frío en los sistemas de recomendación secuenciales, específicamente enfocándose en el desafío de utilizar efectivamente artículos con pocas o ninguna interacción. Los autores proponen un nuevo enfoque que introduce un pequeño delta entrenable en los embeddings de contenido congelados, permitiendo que el modelo adapte las representaciones de los artículos sin desviarse demasiado de su estructura semántica original. El problema del arranque en frío es un desafío significativo para los sistemas de recomendación, especialmente en configuraciones secuenciales donde el modelo predice la próxima interacción de un usuario basándose en su historial. Los artículos con pocas o ninguna interacción plantean dificultades para el modelo, ya que lucha por aprender representaciones efectivas para ellos, lo que lleva a una calidad de recomendación deficiente. Para abordar este problema, el documento investiga el impacto de la inicialización de embeddings basada en contenido en el problema del arranque en frío en los modelos de recomendación secuenciales basados en transformadores. Los enfoques basados en contenido utilizan metadatos del artículo, como descripciones textuales, para construir embeddings para artículos fríos. Sin embargo, el uso directo de embeddings de contenido congelados a menudo resulta en un rendimiento subóptimo, ya que pueden no adaptarse completamente a la tarea de recomendación. Por otro lado, afinar estos embeddings puede degradar el rendimiento para artículos de arranque en frío, ya que las representaciones del artículo pueden desviarse significativamente de su estructura original después del entrenamiento. El enfoque propuesto consta de dos componentes principales: 1. Embeddings de contenido congelados con una norma fija: Estos embeddings sirven como la representación inicial de los artículos y se fijan durante el entrenamiento, asegurando que el modelo retenga la información semántica de los metadatos del artículo. 2. Un vector delta entrenable con una norma acotada: Este vector permite que el modelo ajuste ligeramente las representaciones de los artículos manteniéndolas cerca de los embeddings basados en contenido originales. La restricción de la norma acotada asegura que las correcciones no se desvían demasiado de los embeddings iniciales. El documento demuestra que este enfoque mejora consistentemente el rendimiento en artículos fríos en diferentes conjuntos de datos y modalidades, incluyendo conjuntos de datos de comercio electrónico con descripciones textuales y un conjunto de datos de música con representaciones basadas en audio. Los experimentos muestran que el método propuesto supera a los enfoques existentes, como la inicialización basada en contenido y el afinado, en términos de calidad de recomendación. Las contribuciones principales del documento son: 1. Investigar el impacto de la inicialización de embeddings basada en contenido en el problema del arranque en frío en los modelos de recomendación secuenciales basados en transformadores. 2. Proponer un método que aprende un pequeño delta entrenable con una norma acotada sobre los embeddings de contenido congelados. 3. Demostrar que el enfoque propuesto mejora consistentemente el rendimiento en artículos fríos en diferentes conjuntos de datos y modalidades. El documento concluye que el método propuesto es una solución simple pero efectiva al problema del arranque en frío en los sistemas de recomendación secuenciales, ofreciendo un equilibrio entre aprovechar los metadatos del artículo y permitir que el modelo se adapte a nuevos artículos.


Artículos Recomendados

Surrogados de EDP Multiescala para Predicción y Descalaje: Aplicación a las Corrientes Oceánicas

Marco de análisis de variables instrumentales basado en la estratificación para el análisis de efectos no lineales

Aprender campos electromagnéticos basados en funciones de base de elemento finito

RealBench: Comparación de modelos de generación de Verilog con diseños de IP del mundo real

Extraer información sobre catalizadores de ORR para pilas de combustible de la literatura científica

Una red neuronal informada por la física para modelar fracturas sin daño de gradiente: formulación, aplicación y evaluación

Pruebas de espectroscopia de impedancia in situ de Li$_{4-x}$Ge$_{1-x}$P$_x$O$_4$ como electrolito de estado sólido potencial para baterías de iones de litio micro

Red Profunda del Cerebro: Un Modelo de Aprendizaje Profundo Optimizado para la Detección de Tumores Cerebrales en Imágenes de RMN Utilizando EfficientNetB0 y ResNet50 con Aprendizaje Transferido

VideoITG: Entendimiento Multimodal de Vídeos con Anclaje Temporal Instructivo

Escala sin invariancia conformal desde deformaciones integrables de TFTs de coset