March 26, 2024Open Access

Compartilhando o Custo do Sucesso: Um Jogo para Avaliar e Aprender Políticas Colaborativas de Instrução e Seguimento entre Múltiplos Agentes

Key Points

Key points are not available for this paper at this time.

Abstract

Em cenários colaborativos orientados a objetivos, os participantes não estão apenas interessados em alcançar um resultado bem-sucedido, mas também negociam implicitamente o esforço que empregam na interação (adaptando-se mutuamente). Neste trabalho, propomos um jogo de referência interativo desafiador que requer que dois jogadores coordenem observações visuais e linguísticas. O sinal de aprendizado neste jogo é um escore (dado após jogar) que considera o objetivo alcançado e os esforços assumidos pelos jogadores durante a interação. Demonstramos que uma configuração padrão de Proximal Policy Optimization (PPO) alcança uma alta taxa de sucesso quando inicializada com comportamentos heurísticos de parceiros que implementam insights da análise de interações humanas. Também constatamos que o pareamento de parceiros neurais de fato reduz o esforço conjunto medido ao jogarem repetidamente juntos. Contudo, observamos que, em comparação com um pareamento heurístico razoável, ainda há espaço para melhorias — o que convida a pesquisas adicionais na direção do compartilhamento de custos em interações colaborativas.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Philipp Sadler

Sherzod Hakimov

David Schlangen

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Compartilhando o Custo do Sucesso: Um Jogo para Avaliar e Aprender Políticas Colaborativas de Instrução e Seguimento entre Múltiplos Agentes

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider