A capacidade de um agente incorporado para entender, prever e interagir com seu ambiente depende fundamentalmente de um modelo interno do mundo. Este artigo introduz uma estrutura inovadora para investigar a formação e adaptação de tais modelos do mundo dentro de um substrato biológico: organoides neurais humanos. Apresentamos um currículo de três ambientes virtuais escaláveis e em circuito fechado, projetados para treinar esses agentes biológicos e sondar os mecanismos sinápticos subjacentes à aprendizagem, como a potenciação de longo prazo (LTP) e a depressão de longo prazo (LTD). Detalhamos o design de três ambientes de tarefa distintos que exigem modelos do mundo progressivamente mais sofisticados para a tomada de decisões bem-sucedida: (1) uma tarefa condicional de evitação para aprender contingências estáticas estado-ação, (2) um cenário unidimensional de predador-presa para interação orientada a objetivos, e (3) uma replicação do clássico jogo Pong para modelar sistemas dinâmicos em tempo contínuo. Para cada ambiente, formalizamos os espaços de estado e ação, os mecanismos de codificação sensorial e decodificação motora, e os protocolos de feedback baseados em estimulação previsível (recompensa) e imprevisível (punição), que servem para impulsionar o refinamento do modelo. Em um avanço metodológico significativo, propomos uma abordagem de meta-aprendizagem onde um Large Language Model automatiza o design generativo e a otimização de protocolos experimentais, escalando assim o processo de design de ambiente e currículo. Finalmente, delineamos uma estratégia de avaliação multimodal que vai além do desempenho em tarefas para medir diretamente os correlatos físicos do modelo do mundo aprendido, quantificando a plasticidade sináptica em níveis eletrofisiológicos, celulares e moleculares. Este trabalho preenche a lacuna entre aprendizado por reforço baseado em modelo e neurociência computacional, oferecendo uma plataforma única para o estudo da incorporação, tomada de decisão e a base física da inteligência.
Building similarity graph...
Analyzing shared references across papers
Loading...
Bonnie Hill
Building similarity graph...
Analyzing shared references across papers
Loading...
Bonnie Hill (Qui,) estudou esta questão.
www.synapsesocial.com/papers/68f5fcce8d54a28a75cf1d1b — DOI: https://doi.org/10.48550/arxiv.2509.04633