Les récents progrès des grands modèles de langage ont suscité un intérêt quant à leur potentiel pour la planification de tâches robotiques. Bien que ces modèles démontrent de fortes capacités génératives, leur efficacité à produire des plans structurés et exécutables reste incertaine. Cet article présente une évaluation systématique d'un large éventail de modèles de langage actuels à la pointe de la technologie, chacun directement sollicité à l'aide de fichiers de domaine et de problème en Planning Domain Definition Language, et compare leurs performances de planification avec le planificateur Fast Downward à travers diverses références. En plus de mesurer les taux de réussite, nous évaluons à quel point les plans générés se traduisent fidèlement en séquences d'actions effectivement exécutables, identifiant à la fois les forces et les limites de l'utilisation de ces modèles dans ce contexte. Nos résultats montrent que, si les modèles fonctionnent bien sur des tâches de planification plus simples, ils continuent de rencontrer des difficultés face à des scénarios plus complexes nécessitant une gestion précise des ressources, un suivi d'état cohérent et un respect strict des contraintes. Ces résultats soulignent des défis fondamentaux dans l'application des modèles de langage à la planification robotique en environnements réels. En mettant en lumière les lacunes qui émergent lors de l'exécution, nous visons à orienter la recherche future vers des approches combinées intégrant les modèles de langage avec les planificateurs classiques pour améliorer la fiabilité et la scalabilité de la planification en robotique autonome.
Building similarity graph...
Analyzing shared references across papers
Loading...
Kai Goebel
Patrik Zips
Building similarity graph...
Analyzing shared references across papers
Loading...
Goebel et al. (jeu,) ont étudié cette question.
www.synapsesocial.com/papers/68e7103b90569dd607ee693e — DOI: https://doi.org/10.48550/arxiv.2507.23589
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: