Los puntos clave no están disponibles para este artículo en este momento.
Los sistemas recomendadores basados en aprendizaje profundo por refuerzo (DRL) son adecuados para problemas de usuarios en inicio en frío, ya que pueden captar progresivamente las preferencias del usuario. Sin embargo, la mayoría de los sistemas recomendadores basados en DRL existentes son subóptimos, ya que utilizan la misma política para adaptarse a la dinámica de diferentes usuarios. Reformulamos la recomendación como un proceso de decisión de Markov multitarea, donde cada tarea representa un conjunto de usuarios similares. Dado que los usuarios similares tienen dinámicas más cercanas, una política específica para la tarea es más efectiva que una única política universal para todos los usuarios. Para hacer recomendaciones a usuarios en inicio en frío, usamos una política por defecto para recolectar algunas interacciones iniciales para identificar la tarea del usuario, tras lo cual se emplea una política específica para la tarea. Usamos Q-learning para optimizar nuestro marco y consideramos la incertidumbre de la tarea mediante la información mutua respecto a las tareas. Los experimentos se realizan en tres conjuntos de datos del mundo real para verificar la efectividad de nuestro marco propuesto.
Building similarity graph...
Analyzing shared references across papers
Loading...
Mingsheng Fu
Liwei Huang
Ananya Rao
IEEE Transactions on Industrial Informatics
Nanyang Technological University
University of Electronic Science and Technology of China
University of Macau
Building similarity graph...
Analyzing shared references across papers
Loading...
Fu et al. (Mon,) estudiaron esta cuestión.
www.synapsesocial.com/papers/69deaae440ea065679559010 — DOI: https://doi.org/10.1109/tii.2022.3209290
Synapse has enriched 4 closely related papers on similar clinical questions. Consider them for comparative context: