March 3, 2026

TSPPO : optimisation de politique proximale séquentielle basée sur des transformateurs pour des systèmes multi-agents

La prise de décision séquentielle améliore l'efficacité dans les systèmes multi-agents avec environ 10 % d'amélioration des performances.
Les méthodes d'optimisation de politique réduisent considérablement la complexité des interactions multi-agents, améliorant la coordination.
L'utilisation d'une architecture de transformateur permet une meilleure adaptation aux environnements dynamiques dans les applications en temps réel.
Les résultats suggèrent que ces méthodes pourraient fournir des cadres plus solides pour les développements futurs des systèmes multi-agents.

Cite This Study