Key points are not available for this paper at this time.
Grandes modelos de linguagem (LLMs) oferecem potencial significativo como ferramentas para apoiar uma gama crescente de tarefas decisórias. No entanto, dado seu treinamento em dados humanos (criados por humanos), os LLMs podem herdar tanto vieses sociais contra grupos protegidos quanto estar sujeitos a vieses cognitivos. Tal viés semelhante ao humano pode impedir decisões justas e explicáveis feitas com assistência de LLMs. Nosso trabalho apresenta o BiasBuster, uma estrutura projetada para descobrir, avaliar e mitigar vieses cognitivos em LLMs, particularmente em tarefas decisórias de alto risco. Inspirados por pesquisas anteriores em psicologia e ciências cognitivas, desenvolvemos um conjunto de dados contendo 16.800 prompts para avaliar diferentes vieses cognitivos (por exemplo, induzidos por prompt, sequenciais, inerentes). Testamos várias estratégias de mitigação de viés, enquanto propomos um método inovador usando LLMs para corrigir automaticamente seus próprios prompts. Nossa análise fornece uma visão abrangente sobre a presença e os efeitos do viés cognitivo em diferentes modelos comerciais e de código aberto. Demonstramos que nossa auto-mitigação efetivamente reduz o viés cognitivo sem a necessidade de criar manualmente exemplos para cada tipo de viés.
Building similarity graph...
Analyzing shared references across papers
Loading...
Jessica Maria Echterhoff
Yao Liu
Abeer Alessa
Building similarity graph...
Analyzing shared references across papers
Loading...
Echterhoff et al. (Sáb,) estudaram essa questão.
www.synapsesocial.com/papers/68e77b43b6db6435876efe72 — DOI: https://doi.org/10.48550/arxiv.2403.00811
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: