March 20, 2020Open Access

التعلم المعزز العميق لأنظمة الوكلاء المتعددين: مراجعة التحديات، الحلول، والتطبيقات

Key Points

Key points are not available for this paper at this time.

Abstract

خوارزميات التعلم المعزز (RL) موجودة منذ عقود وتم استخدامها لحل مشاكل اتخاذ القرار التسلسلي المختلفة. ومع ذلك، واجهت هذه الخوارزميات تحديات كبيرة عند التعامل مع بيئات عالية الأبعاد. ساهم التطور الحديث في التعلم العميق في تمكين طرق RL من قيادة سياسات مثلى لوكلاء متقدمين وقادرين على الأداء بكفاءة في هذه البيئات الصعبة. تناقش هذه المقالة جانبًا مهمًا من التعلم المعزز العميق يتعلق بالمواقف التي تتطلب تواصل وتعاون عدة وكلاء لحل مهام معقدة. يُعرض استقصاء لمختلف النهج المتعلقة بمشاكل التعلم المعزز العميق متعدد الوكلاء (MADRL)، بما في ذلك عدم الاستقرار، الرؤية الجزئية، فضاءات الحالة والفعل المستمرة، أساليب تدريب الوكلاء المتعددين، وتعلم النقل بين الوكلاء المتعددين. سيتم تحليل ومناقشة مزايا وعيوب الطرق المستعرضة مع استكشاف تطبيقاتها المقابلة. يُتوقع أن توفر هذه المراجعة رؤى حول طرق MADRL المتنوعة وأن تؤدي إلى تطوير مستقبلية لأساليب تعلم متعددة الوكلاء أكثر صلابة وفائدة عالية لحل مشاكل العالم الحقيقي.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Thanh Thi Nguyen

Ngoc Duy Nguyen

Saeid Nahavandi

Journals

IEEE Transactions on Cybernetics

Actions

Institutions

Deakin University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

التعلم المعزز العميق لأنظمة الوكلاء المتعددين: مراجعة التحديات، الحلول، والتطبيقات

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider