What type of study is this?

This is a Experimental Study study.

October 20, 2025Open Access

A Base Física da Predição: Formação de Modelo do Mundo em Organoides Neurais via um Currículo Gerado por LLM

Key Points

Organoides neurais exibem modelos do mundo adaptativos, melhorando a tomada de decisões em ambientes complexos.
O design do currículo utiliza três ambientes para aprimorar os efeitos de aprendizagem através de tarefas e feedback variados.
Uma abordagem de meta-aprendizagem com um large language model automatiza e otimiza protocolos experimentais de currículo.
O estudo avalia a plasticidade sináptica para entender os fundamentos físicos dos mecanismos neurais de aprendizagem.

Abstract

A capacidade de um agente incorporado para entender, prever e interagir com seu ambiente depende fundamentalmente de um modelo interno do mundo. Este artigo introduz uma estrutura inovadora para investigar a formação e adaptação de tais modelos do mundo dentro de um substrato biológico: organoides neurais humanos. Apresentamos um currículo de três ambientes virtuais escaláveis e em circuito fechado, projetados para treinar esses agentes biológicos e sondar os mecanismos sinápticos subjacentes à aprendizagem, como a potenciação de longo prazo (LTP) e a depressão de longo prazo (LTD). Detalhamos o design de três ambientes de tarefa distintos que exigem modelos do mundo progressivamente mais sofisticados para a tomada de decisões bem-sucedida: (1) uma tarefa condicional de evitação para aprender contingências estáticas estado-ação, (2) um cenário unidimensional de predador-presa para interação orientada a objetivos, e (3) uma replicação do clássico jogo Pong para modelar sistemas dinâmicos em tempo contínuo. Para cada ambiente, formalizamos os espaços de estado e ação, os mecanismos de codificação sensorial e decodificação motora, e os protocolos de feedback baseados em estimulação previsível (recompensa) e imprevisível (punição), que servem para impulsionar o refinamento do modelo. Em um avanço metodológico significativo, propomos uma abordagem de meta-aprendizagem onde um Large Language Model automatiza o design generativo e a otimização de protocolos experimentais, escalando assim o processo de design de ambiente e currículo. Finalmente, delineamos uma estratégia de avaliação multimodal que vai além do desempenho em tarefas para medir diretamente os correlatos físicos do modelo do mundo aprendido, quantificando a plasticidade sináptica em níveis eletrofisiológicos, celulares e moleculares. Este trabalho preenche a lacuna entre aprendizado por reforço baseado em modelo e neurociência computacional, oferecendo uma plataforma única para o estudo da incorporação, tomada de decisão e a base física da inteligência.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Bonnie Hill

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

A Base Física da Predição: Formação de Modelo do Mundo em Organoides Neurais via um Currículo Gerado por LLM

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study