Accueil
Explorer
nav.journalClub
Tendances
Plus
synapse
⌘+K
Langue
Français
Français
TSPPO: transformer-based sequential proximal policy optimization for multi-agent systems | Synapse
March 3, 2026
TSPPO : optimisation de politique proximale séquentielle basée sur des transformateurs pour des systèmes multi-agents
TY
Tao Yang
Beijing Union University
YG
Yuxiao Gao
CX
Cheng Xu
Beijing Union University
See all
Key Points
La prise de décision séquentielle améliore l'efficacité dans les systèmes multi-agents avec environ 10 % d'amélioration des performances.
Les méthodes d'optimisation de politique réduisent considérablement la complexité des interactions multi-agents, améliorant la coordination.
L'utilisation d'une architecture de transformateur permet une meilleure adaptation aux environnements dynamiques dans les applications en temps réel.
Les résultats suggèrent que ces méthodes pourraient fournir des cadres plus solides pour les développements futurs des systèmes multi-agents.
Mark Helpful
Like
Save
Bookmark
Relay
Share
Mark Helpful
Like
Save
Bookmark
Relay
Share
Cite This Study
Copy
Yang et al. (Mar,) ont étudié cette question.
synapsesocial.com/papers/69a765b9badf0bb9e87da32d
https://doi.org/https://doi.org/10.1007/s00530-025-02153-1