Key points are not available for this paper at this time.
خوارزميات التعلم المعزز (RL) موجودة منذ عقود وتم استخدامها لحل مشاكل اتخاذ القرار التسلسلي المختلفة. ومع ذلك، واجهت هذه الخوارزميات تحديات كبيرة عند التعامل مع بيئات عالية الأبعاد. ساهم التطور الحديث في التعلم العميق في تمكين طرق RL من قيادة سياسات مثلى لوكلاء متقدمين وقادرين على الأداء بكفاءة في هذه البيئات الصعبة. تناقش هذه المقالة جانبًا مهمًا من التعلم المعزز العميق يتعلق بالمواقف التي تتطلب تواصل وتعاون عدة وكلاء لحل مهام معقدة. يُعرض استقصاء لمختلف النهج المتعلقة بمشاكل التعلم المعزز العميق متعدد الوكلاء (MADRL)، بما في ذلك عدم الاستقرار، الرؤية الجزئية، فضاءات الحالة والفعل المستمرة، أساليب تدريب الوكلاء المتعددين، وتعلم النقل بين الوكلاء المتعددين. سيتم تحليل ومناقشة مزايا وعيوب الطرق المستعرضة مع استكشاف تطبيقاتها المقابلة. يُتوقع أن توفر هذه المراجعة رؤى حول طرق MADRL المتنوعة وأن تؤدي إلى تطوير مستقبلية لأساليب تعلم متعددة الوكلاء أكثر صلابة وفائدة عالية لحل مشاكل العالم الحقيقي.
Building similarity graph...
Analyzing shared references across papers
Loading...
Thanh Thi Nguyen
Ngoc Duy Nguyen
Saeid Nahavandi
IEEE Transactions on Cybernetics
Deakin University
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Nguyen وآخرون (Fri,) هذا السؤال.
www.synapsesocial.com/papers/69d7dc0df39344339dd18b2c — DOI: https://doi.org/10.1109/tcyb.2020.2977374
Synapse has enriched 3 closely related papers on similar clinical questions. Consider them for comparative context: