Les systèmes de génération augmentée par récupération (RAG) basés sur la similarité vectorielle échouent systématiquement à récupérer des documents sémantiquement liés à la réponse mais pas directement similaires à la requête. Cet article présente WordWeaveWeb, une plateforme multi-locataires open-source Graph-RAG, et introduit Auto-Hop, un algorithme de parcours de graphe adaptatif au budget qui étend la récupération basée sur vecteurs en suivant des relations sémantiques typées entre segments de documents. Auto-Hop utilise un modèle de coût de similarité cosinus inversée (coût = 1 − similarité) avec un budget de parcours fini, produisant une profondeur d'exploration adaptative. Évalué sur deux corpus (274 documents d'entreprise, 4 PDF réglementaires) sur 8 questions, Graph-RAG avec Auto-Hop améliore la couverture contextuelle de +100 % à +180 % et récupère des documents critiques inaccessibles par la recherche vectorielle à tout seuil. Le code complet, les corpus et les traces de benchmark sont publiés sous licence MIT.
Building similarity graph...
Analyzing shared references across papers
Loading...
Jean-François Swistak
Building similarity graph...
Analyzing shared references across papers
Loading...
Jean-François Swistak (Mon,) a étudié cette question.
www.synapsesocial.com/papers/69c37c33b34aaaeb1a67ef4e — DOI: https://doi.org/10.5281/zenodo.19192499
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: