Key points are not available for this paper at this time.
Pesquisadores e profissionais recentemente reformularam poderosos Large Language Models (LLMs) como agentes, permitindo que eles automatizem tarefas complexas principalmente por meio do uso de funções especializadas. Para facilitar o desenvolvimento de agentes LLM, apresentamos um novo paradigma de treinamento de agentes LLM sem modificar os pesos do LLM, o que é particularmente útil quando os LLMs são difíceis ou inacessíveis para modificações. Inspirados em como os humanos continuamente desenvolvem ferramentas para se adaptar a tarefas do mundo real, em vez de mudar nossa estrutura biológica para adequar um conjunto estático de ferramentas, propomos forjar progressivamente as funções do agente para resolver melhor as tarefas posteriores em vez de modificar os pesos do LLM. Tratando as funções como 'parâmetros do agente' aprendíveis e aproveitando a ideia fundamental do treinamento de modelos na inteligência artificial, desenvolvemos o AgentOptimizer, que emprega o LLM para atualizar as funções dos agentes e cria um algoritmo de treinamento do agente com duas estratégias, roll-back e early-stop, para simplificar o processo de treinamento. Com extensos experimentos, mostramos que o paradigma de treinamento de agentes pode melhorar significativamente o desempenho de agentes LLM representativos em várias tarefas posteriores. Também estudamos o comportamento do treinamento do agente em aspectos como curva de aprendizado e transferibilidade de domínio.
Building similarity graph...
Analyzing shared references across papers
Loading...
Shaokun Zhang
Jieyu Zhang
Jiale Liu
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhang et al. (Sáb,) estudaram essa questão.
www.synapsesocial.com/papers/68e78cdeb6db6435876feacd — DOI: https://doi.org/10.48550/arxiv.2402.11359
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: