February 12, 2024Open Access

Grandes Modelos de Linguagem como Agentes em Jogos para Dois Jogadores

Key Points

Key points are not available for this paper at this time.

Abstract

Ao definir formalmente os processos de treinamento de grandes modelos de linguagem (LLMs), que geralmente abrangem pré-treinamento, ajuste fino supervisionado e aprendizado por reforço com feedback humano, dentro de um único e unificado paradigma de aprendizado de máquina, podemos extrair insights fundamentais para o avanço das tecnologias LLM. Este artigo de posicionamento delineia os paralelos entre os métodos de treinamento dos LLMs e as estratégias empregadas para o desenvolvimento de agentes em jogos para dois jogadores, conforme estudado na teoria dos jogos, aprendizado por reforço e sistemas multiagentes. Propomos uma reconceitualização dos processos de aprendizagem dos LLMs em termos de aprendizagem de agentes em jogos baseados em linguagem. Essa estrutura revela perspectivas inovadoras sobre os sucessos e desafios no desenvolvimento de LLMs, oferecendo uma nova compreensão para abordar questões de alinhamento entre outras considerações estratégicas. Além disso, nossa abordagem baseada em jogos para dois jogadores ilumina novas técnicas de preparação de dados e aprendizado de máquina para o treinamento de LLMs.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Yang Liu

Peng Sun

Hang Li

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Grandes Modelos de Linguagem como Agentes em Jogos para Dois Jogadores

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider