Key points are not available for this paper at this time.
Trotz der vielen Fortschritte bei Large Language Models (LLMs) und ihrer beispiellosen schnellen Entwicklung ist ihre Auswirkung und Integration in alle Bereiche unseres täglichen Lebens aus verschiedenen Gründen eingeschränkt. Ein kritischer Faktor, der ihre weitverbreitete Anwendung behindert, ist das Auftreten von Halluzinationen, bei denen LLMs Antworten erfinden, die zwar realistisch klingen, jedoch von der faktischen Wahrheit abweichen. In diesem Artikel stellen wir eine neuartige Methode zur Erkennung von Halluzinationen in großen Sprachmodellen vor, die ein zentrales Problem bei der Einführung dieser Modelle in unterschiedlichen realen Szenarien angeht. Durch umfangreiche Bewertungen über mehrere Datensätze und LLMs, einschließlich Llama-2, untersuchen wir das Maß der Halluzinationen verschiedener aktueller LLMs und demonstrieren die Effektivität unserer Methode, diese automatisch zu erkennen. Bemerkenswert ist, dass wir bei einem spezifischen Experiment mit Llama-2 bis zu 62 % Halluzinationen beobachten, wobei unsere Methode eine Balancierte Genauigkeit (B-ACC) von 87 % erreicht – und das ganz ohne die Nutzung externer Wissensquellen.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yakir Yehuda
Itzik Malkiel
Oren Barkan
Building similarity graph...
Analyzing shared references across papers
Loading...
Yehuda et al. (Tue,) untersuchten diese Frage.
www.synapsesocial.com/papers/68e75b28b6db6435876d2476 — DOI: https://doi.org/10.48550/arxiv.2403.02889
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: