September 26, 2022

نظام توصية بتعلم معزز عميق مع سياسات متعددة للتوصيات

Key Points

Key points are not available for this paper at this time.

Abstract

تُعتبر أنظمة التوصية القائمة على التعلم المعزز العميق (DRL) مناسبة لمشاكل بدء استخدام المستخدم الجديد، حيث يمكنها التقاط تفضيلات المستخدم تدريجياً. ومع ذلك، فإن معظم أنظمة التوصية القائمة على DRL الموجودة غير مثالية، لأنها تستخدم نفس السياسة لتناسب ديناميكيات المستخدمين المختلفين. نقوم بإعادة صياغة التوصية كعملية اتخاذ قرارات ماركوف متعددة المهام، حيث تمثل كل مهمة مجموعة من المستخدمين المتشابهين. ونظراً لأن المستخدمين المتشابهين لديهم ديناميكيات أقرب، فإن السياسة الخاصة بالمهمة تكون أكثر فعالية من سياسة موحدة واحدة لجميع المستخدمين. لجعل التوصيات للمستخدمين الجدد، نستخدم سياسة افتراضية لجمع بعض التفاعلات الأولية لتحديد مهمة المستخدم، وبعدها يتم استخدام سياسة خاصة بالمهمة. نستخدم Q-learning لتحسين إطار عملنا ونأخذ في الاعتبار عدم اليقين في المهام من خلال المعلومات المتبادلة المتعلقة بالمهام. أُجريت تجارب على ثلاث مجموعات بيانات من العالم الحقيقي للتحقق من فعالية إطار العمل المقترح.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Mingsheng Fu

Liwei Huang

Ananya Rao

Journals

IEEE Transactions on Industrial Informatics

Actions

Institutions

Nanyang Technological University

University of Electronic Science and Technology of China

University of Macau

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

نظام توصية بتعلم معزز عميق مع سياسات متعددة للتوصيات

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider