Zusammenfassung - "Loslassen?" Nicht ganz: Anpassung von Item-Cold-Start in sequenziellen Empfehlungen mit inhaltsbasiertem Initialisieren
Titel
"Loslassen?" Nicht ganz: Anpassung von Item-Cold-Start in sequenziellen Empfehlungen mit inhaltsbasiertem Initialisieren
Zeit
2025-07-25 17:57:31
Autor
{"Anton Pembek","Artem Fatkulin","Anton Klenitskiy","Alexey Vasilev"}
Kategorie
{cs.IR,cs.AI,cs.LG}
Link
http://arxiv.org/abs/2507.19473v1
PDF Link
http://arxiv.org/pdf/2507.19473v1
Zusammenfassung
Dieser Artikel befasst sich mit dem Problem des kalten Starts in sequenziellen Empfehlungssystemen, insbesondere mit der Herausforderung, Artikel mit wenigen oder gar keinen Interaktionen effektiv zu nutzen. Die Autoren schlagen einen neuen Ansatz vor, der eine kleine trainierbare Delta-Änderung in festgelegte Inhalteinbegriffskerne einführt, was dem Modell ermöglicht, die Item-Repräsentationen anzupassen, ohne dabei zu weit von ihrer ursprünglichen semantischen Struktur abzuweichen.
Das Problem des kalten Starts ist eine erhebliche Herausforderung für Empfehlungssysteme, insbesondere in sequenziellen Szenarien, in denen das Modell eine Benutzerinteraktion basierend auf seiner Geschichte vorhersiegt. Artikel mit wenigen oder gar keinen Interaktionen bereiten dem Modell Schwierigkeiten, da es Schwierigkeiten hat, effektive Repräsentationen für diese zu lernen, was zu schlechter Empfehlungsqualität führt.
Um dieses Problem zu lösen, untersucht der Artikel den Einfluss der initialen Embedding-Initialisierung basierend auf dem Inhalt auf das Problem des kalten Starts in auf Transformer basierenden sequenziellen Empfehlungsmodellen. Inhaltsbasierte Ansätze nutzen Item-Metadaten, wie Textbeschreibungen, um Embeddings für kalte Artikel zu erstellen. Der direkte Einsatz gefrorener Inhalteinbegriffskerne führt jedoch oft zu suboptimaler Leistung, da sie möglicherweise nicht vollständig an die Empfehlungsaufgabe angepasst sind. Andererseits kann das Feintunen dieser Embeddings die Leistung für kalte-Start-Artikel verschlechtern, da die Item-Repräsentationen nach der Trainingsschleife erheblich von ihrer ursprünglichen Struktur abweichen können.
Der vorgeschlagene Ansatz besteht aus zwei Hauptkomponenten:
1. Gefrorene Inhalteinbegriffskerne mit festgelegter Norm: Diese Embeddings dienen als die initialen Repräsentationen der Artikel und bleiben während des Trainings fest, was sicherstellt, dass das Modell die semantische Information aus den Item-Metadaten beibehält.
2. Ein kleiner, trainierbarer Delta-Vektor mit begrenzter Norm: Dieser Vektor ermöglicht es dem Modell, die Item-Repräsentationen leicht anzupassen, während sie nahe an den ursprünglichen inhaltsbasierten Embeddings bleiben. Die Begrenzungsbedingung der Norm stellt sicher, dass die Korrekturen nicht zu weit von den ursprünglichen Embeddings abweichen.
Der Artikel zeigt, dass dieser Ansatz die Leistung auf kalten Artikeln in verschiedenen Datensätzen und Modalitäten konsistent verbessert, einschließlich E-Commerce-Datensätzen mit Textbeschreibungen und einem Musikdatensatz mit auf Audio basierenden Repräsentationen. Die Experimente zeigen, dass das vorgeschlagene Verfahren im Vergleich zu bestehenden Ansätzen wie inhaltsbasierten Initialisierungen und Feintunen in Bezug auf Empfehlungsqualität übertrifft.
Die Hauptbeiträge des Artikels sind:
1. Die Untersuchung des Einflusses der initialen Embedding-Initialisierung basierend auf dem Inhalt auf das Problem des kalten Starts in auf Transformer basierenden sequenziellen Empfehlungsmodellen.
2. Ein Verfahren vorschlagen, das einen kleinen, trainierbaren Delta-Vektor mit begrenzter Norm auf gefrorenen Inhalteinbegriffskernen lernt.
3. Demonstrieren, dass der vorgeschlagene Ansatz die Leistung auf kalten Artikeln in verschiedenen Datensätzen und Modalitäten konsistent verbessert.
Der Artikel schließt, dass der vorgeschlagene Ansatz eine einfache aber effektive Lösung für das Problem des kalten Starts in sequenziellen Empfehlungssystemen ist, die zwischen der Nutzung von Item-Metadaten und der Anpassung des Modells an neue Artikel einen Ausgleich bietet.
Empfohlene Papiere
Fristenbewusste gemeinsame Aufgabenplanung und Offloading in mobilen Edge-Computing-Systemen
Analyse von Designalgorithmen und Herstellung einer graphenbasierten Struktur mit doppeltem Krümmung und ebene sechseckigen Paneelen
Hydrodynamische Einblicke treiben multimodale Wirbelfeld-Dynamik durch Strömungslinieneingriffe an.
DENSE: Erstellung von Längsschnitt-Notizen mit zeitlicher Modellierung heterogener klinischer Notizen über mehrere Krankenhausaufenthalte
Ein diskreter Analogon von Tuttes baryzentrischen Einfassungen auf Oberflächen
Demonstration von monolithisch integrierten 3D-TFTs auf GaN HEMTs unter Verwendung einer Cascode-Konfiguration mit hoher Bruchspannung (>1900V)
Axiale symmetrische zweitordentliche Störungen rotierender Hauptreihensternen
Laufen im KREIS? Ein einfaches Benchmark für die Sicherheit von LLM-Code-Interpreten
SafeWork-R1: Ko-evolvierende Sicherheit und Intelligenz unter dem AI-45$^{\circ}$-Gesetz
Neue Isobar-Modelle für $K^+Λ$-Elektroproduktion