A avaliação manual de planos enfrenta desafios de confiabilidade e escalabilidade. Esta pesquisa compara avaliações humanas com um grande modelo de linguagem (LLM) usando uma abordagem multiagente e/ou geração aumentada por recuperação (RAG) para automatizar tarefas complexas de análise de conteúdo. Descobrimos que os LLMs geralmente apresentam desempenho comparável ao humano, com a maioria dos erros originada de excesso de implicação e conhecimento limitado do domínio. A abordagem multiagente aprimora substancialmente o desempenho do LLM, reduzindo erros comuns da máquina em mais de 50%. Integrar essas ferramentas de LLM com supervisão humana provavelmente se tornará a nova norma para análise de conteúdo, e este estudo demonstra como aproveitar a eficiência e precisão da inteligência artificial (IA) junto com o entendimento contextual e expertise de domínio humanos.
Building similarity graph...
Analyzing shared references across papers
Loading...
Xinyu Fu
Chaosu Li
Journal of Planning Education and Research
University of Hong Kong
Texas A&M University
Hong Kong University of Science and Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
Fu et al. (Ter,) estudaram essa questão.
www.synapsesocial.com/papers/68d44b3f31b076d99fa55165 — DOI: https://doi.org/10.1177/0739456x251372082
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: