Zusammenfassung Retrieval-Augmented Generation (RAG) gilt derzeit als pragmatischer Ansatz, um große Sprachmodelle mit verlässlichen Informationen zu verbinden. In der Praxis zeigt sich jedoch, dass RAG die bekannten Probleme generativer KI nicht automatisch löst, sondern häufig verschiebt: Statt frei zu halluzinieren, entstehen Fehler nun durch unvollständiges Retrieval, ungeeignete Chunking-Strategien und fehlende Kontextkohärenz. Die Ursache liegt weniger im Modell als in der Struktur der zugrunde liegenden Dokumente und der Art, wie Informationen aufbereitet werden. Der Autor argumentiert, dass die klassische Informationswissenschaft der entscheidende, bisher weitgehend übersehene Erfolgsfaktor für RAG-Systeme ist. Kompetenzen wie Dokumentanalyse, Relevanzbewertung, Kontextmodellierung und Quellenkritik bestimmen maßgeblich, ob ein System belastbare Antworten liefert oder bloß plausible Formulierungen erzeugt. Auf dieser Grundlage wird ein strukturorientiertes RAG-Modell vorgestellt, das Kapitel- und Abschnittsretrieval, dokumentlogisches Chunking, mehrstufiges Reranking und evidenznahe Antwortformate kombiniert. Die Analyse zeigt: Verlässliche RAG-Systeme entstehen nicht durch größere Modelle, sondern durch die Verbindung semantischer Technologie mit informationswissenschaftlicher Praxis.
Bernhard Wahl (Wed,) studied this question.