التعلم التعزيزي متعدد الوكلاء: مراجعة للتحديات والتطبيقات | Synapse