Die manuelle Planauswertung steht vor Herausforderungen hinsichtlich Zuverlässigkeit und Skalierbarkeit. Diese Forschung vergleicht menschliche Bewertungen mit einem großen Sprachmodell (LLM) unter Verwendung eines Multi-Agenten-Ansatzes und/oder retrieval-unterstützter Generierung (RAG), um komplexe Inhaltsanalyseaufgaben zu automatisieren. Wir stellen fest, dass LLMs im Allgemeinen vergleichbare Leistungen wie Menschen erzielen, wobei die meisten Fehler auf Überimplikationen und begrenztes Domänenwissen zurückzuführen sind. Der Multi-Agenten-Ansatz verbessert die Leistung des LLM erheblich und reduziert häufige maschinelle Fehler um über 50 Prozent. Die Integration solcher LLM-Tools mit menschlicher Aufsicht wird voraussichtlich zum neuen Standard für Inhaltsanalysen; diese Studie zeigt, wie die Effizienz und Präzision künstlicher Intelligenz (KI) zusammen mit dem kontextuellen Verständnis und der Fachkenntnis von Menschen genutzt werden kann.
Building similarity graph...
Analyzing shared references across papers
Loading...
Xinyu Fu
Chaosu Li
Journal of Planning Education and Research
University of Hong Kong
Texas A&M University
Hong Kong University of Science and Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
Fu et al. (Tue,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68d44b3f31b076d99fa55165 — DOI: https://doi.org/10.1177/0739456x251372082
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: