Multimodale Empfehlungssysteme (MRS) integrieren heterogene Nutzer- und Objektdaten, wie Text, Bilder und strukturierte Informationen, um die Empfehlungsleistung zu verbessern. Das Aufkommen großer Sprachmodelle (LLMs) eröffnet neue Möglichkeiten für MRS, indem sie semantisches Schließen, Lernen im Kontext und dynamische Eingabeverarbeitung ermöglichen. Im Vergleich zu früheren vortrainierten Sprachmodellen (PLMs) bieten LLMs größere Flexibilität und Generalisierungsfähigkeiten, bringen jedoch auch Herausforderungen in Bezug auf Skalierbarkeit und Modellzugänglichkeit mit sich. Diese Übersicht präsentiert eine umfassende Review der jüngsten Arbeiten an der Schnittstelle von LLMs und MRS, mit Fokus auf Prompting-Strategien, Feinabstimmungsmethoden und Techniken zur Datenanpassung. Wir schlagen eine neuartige Taxonomie zur Charakterisierung von Integrationsmustern vor, identifizieren übertragbare Techniken aus verwandten Empfehlungsdomänen, geben einen Überblick über Evaluationsmetriken und Datensätze und weisen auf mögliche zukünftige Forschungsrichtungen hin. Wir zielen darauf ab, die aufkommende Rolle der LLMs in der multimodalen Empfehlung zu klären und zukünftige Forschung in diesem sich schnell entwickelnden Bereich zu unterstützen.
Building similarity graph...
Analyzing shared references across papers
Loading...
Alejo Lopez-Avila
Jinhua Du
Building similarity graph...
Analyzing shared references across papers
Loading...
Lopez-Avila et al. (Wed,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68f147cc724575985c3fd18a — DOI: https://doi.org/10.48550/arxiv.2505.09777
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: