Key points are not available for this paper at this time.
تحسين أهداف متعددة في الوقت ذاته مهمة مهمة في منصات التوصية لتحسين أدائها على مختلف الجبهات. ومع ذلك، فإن هذه المهمة تمثل تحديًا خاصًا نظرًا لأن العلاقات بين الأهداف المختلفة متغايرة عبر مستهلكين مختلفين ومتقلبة ديناميكيًا وفقًا لسياقات مختلفة. خاصة في الحالات التي تصبح فيها الأهداف متضاربة مع بعضها البعض، تشكل نتائج التوصيات جبهة باريتو، حيث يأتي التحسن في أي هدف على حساب انخفاض الأداء في هدف آخر. لسوء الحظ، فإن أنظمة التوصية متعددة الأهداف الحالية لا تأخذ هذه العلاقات في الاعتبار بشكل منهجي؛ بل توازن بين هذه الأهداف بطريقة ثابتة وموحدة، مما يؤدي إلى أداء أسوأ بكثير من المثالية الباريتوية. في هذه الورقة، نقترح نهج التعلم المعزز العميق باريتو (DeepPRL)، حيث نقوم بـ (1) نموذج العلاقات المعقدة بين الأهداف المتعددة في التوصيات بشكل شامل؛ (2) التقاط تفضيلات المستهلك الشخصية والسياقية تجاه كل هدف وتحديث التوصيات وفقًا لذلك؛ (3) تحسين أداء التوصيات متعددة الأهداف سواء على المدى القصير أو الطويل. نتيجة لذلك، يحقق منهجنا سيطرة باريتو كبيرة على أفضل النماذج الحالية في تجارب غير متداخلة شاملة أجريت على ثلاث مجموعات بيانات واقعية. علاوة على ذلك، أجرينا تجربة خاضعة للرقابة كبيرة النطاق عبر الإنترنت على منصة بث الفيديو التابعة لأليبابا، حيث قام منهجنا بتحسين الأهداف المتضاربة الثلاثة معدل النقر، مشاهدة الفيديو، ووقت التوقف بنسبة 2%، 5%، و7% على التوالي مقارنة بأحدث نظام الإنتاج، مما يبرهن على تأثيره الاقتصادي الملموس في التطبيقات الصناعية.
Building similarity graph...
Analyzing shared references across papers
Loading...
Li Pan
Alexander Tuzhilin
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Pan وآخرون هذا السؤال.
www.synapsesocial.com/papers/68e6180bb6db6435875aae6c — DOI: https://doi.org/10.48550/arxiv.2407.03580
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: