What type of study is this?

This is a Quantitative Study study.

October 10, 2025Open Access

FloorplanQA: Um Referencial para Raciocínio Espacial em LLMs usando Representações Estruturadas

Key Points

FloorplanQA revela uma lacuna na capacidade dos grandes modelos de linguagem de raciocinar consistentemente sobre layouts espaciais.
Modelos têm sucesso em consultas simples, mas enfrentam dificuldades com restrições como posicionamento de objetos e visibilidade.
O referencial testa várias tarefas espaciais, incluindo medição de distância e busca de caminho em ambientes internos.
Os resultados indicam a necessidade de avanços em modelos de linguagem para inferir e manipular com precisão propriedades espaciais.

Abstract

Introduzimos o FloorplanQA, um referencial diagnóstico para avaliação do raciocínio espacial em grandes modelos de linguagem (LLMs). O FloorplanQA baseia-se em representações estruturadas de ambientes internos, como cozinhas, salas de estar, quartos, banheiros e outros, codificados simbolicamente em layouts JSON ou XML. O referencial cobre tarefas espaciais essenciais, incluindo medição de distância, visibilidade, busca de caminho e posicionamento de objetos em espaços restritos. Nossos resultados, analisando uma variedade de LLMs open-source e comerciais de ponta, revelam que embora os modelos possam ter sucesso em consultas superficiais, eles frequentemente falham ao respeitar restrições físicas e preservar a coerência espacial, embora permaneçam em sua maioria robustos a pequenas perturbações espaciais. O FloorplanQA revela um ponto cego nos LLMs atuais: raciocínio inconsistente sobre layouts internos. Esperamos que este referencial inspire novos trabalhos em modelos de linguagem capazes de inferir e manipular com precisão propriedades espaciais e geométricas em contextos práticos.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Fedor Rodionov

Abdelrahman Eldesokey

Michael Birsak

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

FloorplanQA: Um Referencial para Raciocínio Espacial em LLMs usando Representações Estruturadas

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider