What question did this study set out to answer?

The paper examines the limitations of retrieval-augmented generation (RAG) systems and argues for the integration of information science principles.

April 12, 2026

KI: Semantik stark, Generierung schwach: Warum RAG-Systeme eine informationswissenschaftliche Architektur brauchen

Key Points

The paper examines the limitations of retrieval-augmented generation (RAG) systems and argues for the integration of information science principles.
Analyzed existing issues with RAG, including incomplete retrieval and context coherence.
Developed a structure-oriented RAG model incorporating chapter and section retrieval.
Emphasized document-logical chunking and multi-stage reranking techniques.
Identified that RAG systems fail not due to model size but due to information structuring issues.
Showed that applying information science concepts enhances the reliability of RAG outputs.

Abstract

Zusammenfassung Retrieval-Augmented Generation (RAG) gilt derzeit als pragmatischer Ansatz, um große Sprachmodelle mit verlässlichen Informationen zu verbinden. In der Praxis zeigt sich jedoch, dass RAG die bekannten Probleme generativer KI nicht automatisch löst, sondern häufig verschiebt: Statt frei zu halluzinieren, entstehen Fehler nun durch unvollständiges Retrieval, ungeeignete Chunking-Strategien und fehlende Kontextkohärenz. Die Ursache liegt weniger im Modell als in der Struktur der zugrunde liegenden Dokumente und der Art, wie Informationen aufbereitet werden. Der Autor argumentiert, dass die klassische Informationswissenschaft der entscheidende, bisher weitgehend übersehene Erfolgsfaktor für RAG-Systeme ist. Kompetenzen wie Dokumentanalyse, Relevanzbewertung, Kontextmodellierung und Quellenkritik bestimmen maßgeblich, ob ein System belastbare Antworten liefert oder bloß plausible Formulierungen erzeugt. Auf dieser Grundlage wird ein strukturorientiertes RAG-Modell vorgestellt, das Kapitel- und Abschnittsretrieval, dokumentlogisches Chunking, mehrstufiges Reranking und evidenznahe Antwortformate kombiniert. Die Analyse zeigt: Verlässliche RAG-Systeme entstehen nicht durch größere Modelle, sondern durch die Verbindung semantischer Technologie mit informationswissenschaftlicher Praxis.

Bookmark

Cite This Study

Bernhard Wahl (Wed,) studied this question.

synapsesocial.com/papers/69db388e4fe01fead37c6a4d https://doi.org/https://doi.org/10.1515/iwp-2026-2001

Bookmark