Key points are not available for this paper at this time.
Modelos de linguagem podem gerar informações falsas ao realizar raciocínio matemático complexo e detalhado. A física oferece um domínio rico para avaliar capacidades de raciocínio matemático onde o contexto físico confere o uso de símbolos que precisam satisfazer semânticas complexas (por exemplo, unidades, ordem tensorial), resultando em casos em que a inferência pode ser algebricamente coerente, mas não física. Neste trabalho, avaliamos a capacidade dos Modelos de Linguagem (LMs) para realizar raciocínio matemático e físico de granularidade fina usando um conjunto de dados selecionado que abrange múltiplas notações e subdomínios da Física. Melhoramos os resultados zero-shot usando exemplos sintéticos no contexto, e demonstramos degradação não linear da qualidade da derivação com o aumento da força da perturbação via omissão progressiva de premissas de apoio. Constatamos que o raciocínio matemático dos modelos não é informado pela física neste cenário, onde o contexto físico é predominantemente ignorado em favor da engenharia reversa das soluções.
Building similarity graph...
Analyzing shared references across papers
Loading...
Jordan Meadows
Tamsin Emily James
André Freitas
Building similarity graph...
Analyzing shared references across papers
Loading...
Meadows et al. (Sun,) estudaram esta questão.
www.synapsesocial.com/papers/68e6d2ecb6db643587650f7e — DOI: https://doi.org/10.48550/arxiv.2404.18384
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: