What question did this study set out to answer?

O objetivo é desenvolver uma estrutura que permita que agentes de IA refinem continuamente seu contexto sem alterar seu modelo subjacente.

March 18, 2026Open Access

Rumo a Agentes Autoevolutivos: Uma Estrutura de Duplo Processo para Refinamento Contínuo de Contexto

Key Points

O objetivo é desenvolver uma estrutura que permita que agentes de IA refinem continuamente seu contexto sem alterar seu modelo subjacente.
Introduziu a estrutura do Agente de Duplo Processo (DPA) para episódios de interação.
Utilizou um Sistema 1 rápido para respostas imediatas e um Sistema 2 lento para reflexão.
Manteve entradas de memória em formato de bullet points com estatísticas para prevenir degradação.
Empregou um portão curador para filtrar atualizações de memória redundantes ou pouco úteis.
Realizou experimentos em seis benchmarks diversos para avaliar o desempenho.
O DPA superou consistentemente o prompting padrão e linhas de base competitivas.
Alcançou o melhor desempenho geral em múltiplas tarefas que exigem raciocínio e conhecimento intensivo.
Demonstrou refinamento contínuo de contexto eficaz em interações de IA.

Abstract

Grandes Modelos de Linguagem (LLMs) tornaram-se essenciais para sistemas de IA interativos, porém permanecem fundamentalmente estáticos após o lançamento: eles não podem atualizar seus parâmetros a partir do feedback da interação e frequentemente repetem os mesmos erros ao longo de longas sequências de interação. Propomos o Agente de Duplo Processo (DPA), uma estrutura para refinamento contínuo de contexto que possibilita o aprendizado sem modificar a espinha dorsal do modelo congelado. Inspirado pela teoria de duplo processo da ciência cognitiva, o DPA decompõe cada episódio de interação em dois processos complementares: um Sistema 1 rápido que recupera contexto compacto e relevante de uma memória de longo prazo explícita e gera respostas, e um Sistema 2 lento que reflete sobre os resultados e escreve atualizações selecionadas de volta na memória. Para evitar a degradação da memória em interações prolongadas, o DPA mantém entradas de memória em formato de bullet points com estatísticas de utilidade e emprega um portão curador conservador que filtra inserções genéricas, redundantes ou conflitantes. Experimentos em seis benchmarks diversos demonstram que o DPA supera consistentemente o prompting padrão e linhas de base competitivas tanto nos backbones GPT-5.1 quanto Llama-3.1-8B, alcançando o melhor desempenho geral em múltiplas tarefas que exigem raciocínio e conhecimento intensivo.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Liangyu Teng

Wei Ni

Liang Song

Journals

Electronics

Actions

Institutions

Fudan University

China State Construction Engineering (China)

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Rumo a Agentes Autoevolutivos: Uma Estrutura de Duplo Processo para Refinamento Contínuo de Contexto

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider