July 3, 2024Open Access

التعلم المعزز العميق باريتو لنظام التوصية متعدد الأهداف

Key Points

Key points are not available for this paper at this time.

Abstract

تحسين أهداف متعددة في الوقت ذاته مهمة مهمة في منصات التوصية لتحسين أدائها على مختلف الجبهات. ومع ذلك، فإن هذه المهمة تمثل تحديًا خاصًا نظرًا لأن العلاقات بين الأهداف المختلفة متغايرة عبر مستهلكين مختلفين ومتقلبة ديناميكيًا وفقًا لسياقات مختلفة. خاصة في الحالات التي تصبح فيها الأهداف متضاربة مع بعضها البعض، تشكل نتائج التوصيات جبهة باريتو، حيث يأتي التحسن في أي هدف على حساب انخفاض الأداء في هدف آخر. لسوء الحظ، فإن أنظمة التوصية متعددة الأهداف الحالية لا تأخذ هذه العلاقات في الاعتبار بشكل منهجي؛ بل توازن بين هذه الأهداف بطريقة ثابتة وموحدة، مما يؤدي إلى أداء أسوأ بكثير من المثالية الباريتوية. في هذه الورقة، نقترح نهج التعلم المعزز العميق باريتو (DeepPRL)، حيث نقوم بـ (1) نموذج العلاقات المعقدة بين الأهداف المتعددة في التوصيات بشكل شامل؛ (2) التقاط تفضيلات المستهلك الشخصية والسياقية تجاه كل هدف وتحديث التوصيات وفقًا لذلك؛ (3) تحسين أداء التوصيات متعددة الأهداف سواء على المدى القصير أو الطويل. نتيجة لذلك، يحقق منهجنا سيطرة باريتو كبيرة على أفضل النماذج الحالية في تجارب غير متداخلة شاملة أجريت على ثلاث مجموعات بيانات واقعية. علاوة على ذلك، أجرينا تجربة خاضعة للرقابة كبيرة النطاق عبر الإنترنت على منصة بث الفيديو التابعة لأليبابا، حيث قام منهجنا بتحسين الأهداف المتضاربة الثلاثة معدل النقر، مشاهدة الفيديو، ووقت التوقف بنسبة 2%، 5%، و7% على التوالي مقارنة بأحدث نظام الإنتاج، مما يبرهن على تأثيره الاقتصادي الملموس في التطبيقات الصناعية.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Li Pan

Alexander Tuzhilin

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

التعلم المعزز العميق باريتو لنظام التوصية متعدد الأهداف

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider