Key points are not available for this paper at this time.
Avanços recentes em Inteligência Artificial Generativa, particularmente no domínio dos Grandes Modelos de Linguagem (LLMs) e Grandes Modelos de Linguagem e Visão (LVLMs), possibilitaram a perspectiva de aproveitamento de planejadores cognitivos em sistemas robóticos. Este trabalho foca em resolver o problema de navegação com objetivo de objeto imitando a cognição humana para atender, perceber e armazenar informações específicas da tarefa e gerar planos com base nelas. Apresentamos uma estrutura abrangente capaz de explorar um ambiente desconhecido em busca de um objeto, aproveitando as capacidades dos Grandes Modelos de Linguagem (LLMs) e dos Grandes Modelos de Linguagem e Visão (LVLMs) na compreensão da semântica subjacente do nosso mundo. Uma tarefa desafiadora no uso de LLMs para gerar subobjetivos de alto nível é representar eficientemente o ambiente ao redor do robô. Propomos usar uma representação modular de cena 3D, com descrições semanticamente ricas do objeto, para fornecer ao LLM informações relevantes para a tarefa. Contudo, prover o LLM com uma grande quantidade de informação contextual (representação semântica rica da cena 3D) pode levar a planos redundantes e ineficientes. Propomos usar um podador baseado em LLM que aproveita as capacidades de aprendizado em contexto para eliminar informações irrelevantes específicas do objetivo.
Building similarity graph...
Analyzing shared references across papers
Loading...
P. Arjun
Andrew Melnik
Gora Chand Nandi
Building similarity graph...
Analyzing shared references across papers
Loading...
Arjun et al. (Sat,) estudaram esta questão.
www.synapsesocial.com/papers/68e71ab4b6db6435876947f1 — DOI: https://doi.org/10.48550/arxiv.2404.00318
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: