Résumé - Laisser tomber ? Pas tout à fait : Aborder le problème du démarrage difficile des articles dans les recommandations séquentielles avec une initialisation basée sur le contenu

Titre
Laisser tomber ? Pas tout à fait : Aborder le problème du démarrage difficile des articles dans les recommandations séquentielles avec une initialisation basée sur le contenu

Temps
2025-07-25 17:57:31

Auteur
{"Anton Pembek","Artem Fatkulin","Anton Klenitskiy","Alexey Vasilev"}

Catégorie
{cs.IR,cs.AI,cs.LG}

Lien
http://arxiv.org/abs/2507.19473v1

PDF Lien
http://arxiv.org/pdf/2507.19473v1

Résumé

Ce document aborde le problème du démarrage froid dans les systèmes de recommandation séquentiels, en se concentrant spécifiquement sur le défi d'utiliser efficacement des articles avec peu ou pas d'interactions. Les auteurs proposent une approche nouvelle qui introduit un petit delta entraînable appliqué aux embeddings de contenu figés, permettant au modèle de s'adapter aux représentations des articles sans s'éloigner trop de leur structure sémantique originale. Le problème du démarrage froid est une grande difficulté pour les systèmes de recommandation, en particulier dans les environnements séquentiels où le modèle prédit la prochaine interaction d'un utilisateur en se basant sur son historique. Les articles avec peu ou pas d'interactions posent des difficultés au modèle, car il a du mal à apprendre des représentations efficaces pour eux, ce qui conduit à une qualité de recommandation médiocre. Pour traiter ce problème, le document enquête sur l'impact de l'initialisation des embeddings basés sur le contenu sur le problème du démarrage froid dans les modèles de recommandation séquentiels basés sur les transformateurs. Les approches basées sur le contenu exploitent les métadonnées des articles, telles que les descriptions textuelles, pour construire des embeddings pour les articles cold items. Cependant, l'utilisation directe des embeddings de contenu figés entraîne souvent une performance sous-optimal, car ils peuvent ne pas s'adapter pleinement à la tâche de recommandation. D'autre part, l'ajustement fin des embeddings peut dégrader la performance pour les articles cold-start, car les représentations des articles peuvent drift considérablement de leur structure originale après l'entraînement. L'approche proposée se compose de deux principaux composants : 1. Embeddings de contenu figés avec une norme fixe : Ces embeddings servent de représentation initiale des articles et sont fixés pendant l'entraînement, assurant que le modèle conserve l'information sémantique des métadonnées de l'article. 2. Un petit vecteur delta entraînable avec une norme bornée : Ce vecteur permet au modèle de légèrement ajuster les représentations des articles tout en les maintenant proches des embeddings de contenu initiaux. La contrainte de norme bornée assure que les corrections ne s'éloignent pas trop des embeddings initiaux. Le document démontre que cette approche améliore constamment la performance sur les articles cold items sur différents ensembles de données et modalités, y compris des ensembles de données de commerce électronique avec des descriptions textuelles et un ensemble de données de musique avec des représentations basées sur l'audio. Les expériences montrent que la méthode proposée dépasse les approches existantes, telles que l'initialisation basée sur le contenu et l'ajustement fin, en termes de qualité de recommandation. Les contributions principales du document sont : 1. Enquêter sur l'impact de l'initialisation des embeddings basés sur le contenu sur le problème du démarrage froid dans les modèles de recommandation séquentiels basés sur les transformateurs. 2. Proposer une méthode qui apprend un petit delta entraînable avec une norme bornée au-dessus des embeddings de contenu figés. 3. Démontrer que l'approche proposée améliore constamment la performance sur les articles cold items sur différents ensembles de données et modalités. Le document conclut que la méthode proposée est une solution simple mais efficace au problème du démarrage froid dans les systèmes de recommandation séquentiels, offrant un équilibre entre l'utilisation des métadonnées de l'article et la capacité du modèle à s'adapter à de nouveaux articles.


Articles Recommandés

Fonctions carrées et estimations variationnelles pour les opérateurs de Ritt sur $L^1$

Caractérisation des performances du modèle hybride de langage SSM-Transformer avec une longueur de contexte prolongée

L'Enquête sur les Abondances Chimiques et la Cartographie des Groupes Ouverts : VIII. Analyse du Gradient Chimique Galactique et Azimutale à partir de SDSS/MWM DR19

Étape-3 : Grand mais abordable : Co-conception du modèle-système pour un décodage efficace en termes de coût

Détection des anneaux galactiques dans les études d'imagerie de succession du DESI avec un apprentissage profond semi-supervisé

MOFCO : Déchargement de tâches conscient de la mobilité et de la migration dans des environnements de calcul nuageux à trois couches

GENIAL : Exploration de l'espace de conception générique via l'inversion de réseau pour des unités logiques algorithmiques à faible consommation d'énergie

Flattening en $L^2$ des mesures auto-similaires sur des courbes non-dégénérées

Circuits p-Économes en Énergie pour les Réseaux de Neurones Génératifs

Solutions Exactes pour les Distributions Bimodales sous Irradiation Stochastique de Plasma dans les Films Minces