Key points are not available for this paper at this time.
Multi-hop QA (MHQA) beinhaltet schrittweises logisches Schlussfolgern, um komplexe Fragen zu beantworten und mehrere relevante unterstützende Fakten zu finden. Allerdings bleibt die Schlussfolgerungsfähigkeit bestehender großer Sprachmodelle (LLMs) im Multi-Hop-Frage-Antworten unerforscht und ist unzureichend für das Beantworten von Multi-Hop-Fragen. Zudem ist unklar, ob LLMs einer gewünschten Schlusskette folgen, um zur richtigen Endantwort zu gelangen. In dieser Arbeit schlagen wir eine generative Fragendekompositionsmethode (GenDec) aus der Perspektive erklärbarer QA vor, indem unabhängige und vollständige Unterfragen generiert werden, basierend auf der Integration zusätzlicher extrahierter Beweise, um die Schlussfolgerungsfähigkeit von LLMs im RAG zu verbessern. Um die Wirkung, Generalisierung und Robustheit von GenDec zu demonstrieren, führen wir zwei Experimente durch: Das erste kombiniert GenDec mit kleinen QA-Systemen bei Absatzabruf- und QA-Aufgaben. Wir untersuchen zweitens die Schlussfolgerungsfähigkeiten verschiedener modernster LLMs, einschließlich GPT-4 und GPT-3.5, kombiniert mit GenDec. Wir experimentieren mit den Datensätzen HotpotQA, 2WikihopMultiHopQA, MuSiQue und PokeMQA.
Building similarity graph...
Analyzing shared references across papers
Loading...
Jian Wu
Linyi Yang
Yuliang Ji
Building similarity graph...
Analyzing shared references across papers
Loading...
Wu et al. (Fri,) haben diese Frage untersucht.
www.synapsesocial.com/papers/68e78e33b6db6435876ffa88 — DOI: https://doi.org/10.48550/arxiv.2402.11166
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: