February 10, 2022Open Access

InPars: Datenaugmentation für die Informationsrückgewinnung mithilfe großer Sprachmodelle

Key Points

Key points are not available for this paper at this time.

Abstract

Die Informationsrückgewinnungsgemeinschaft hat kürzlich eine Revolution durch große vortrainierte Transformermodelle erlebt. Ein weiterer wesentlicher Faktor für diese Revolution war der MS MARCO Datensatz, dessen Umfang und Vielfalt ein Zero-Shot Transferlernen für verschiedenste Aufgaben ermöglicht haben. Allerdings können nicht alle IR-Aufgaben und -Domänen gleichermaßen von einem einzigen Datensatz profitieren. Umfangreiche Forschungen in verschiedenen NLP-Aufgaben haben gezeigt, dass die Verwendung domänenspezifischer Trainingsdaten gegenüber allgemeinen Trainingsdaten die Leistung neuronaler Modelle verbessert. In dieser Arbeit nutzen wir die Few-Shot-Fähigkeiten großer vortrainierter Sprachmodelle als synthetische Datengeneratoren für IR-Aufgaben. Wir zeigen, dass Modelle, die ausschließlich auf unserem unüberwachten Datensatz feinabgestimmt sind, starke Baselines wie BM25 sowie kürzlich vorgeschlagene selbstüberwachte dichte Retrieval-Methoden übertreffen. Darüber hinaus erzielen Retrieval-Modelle, die sowohl auf überwachten als auch auf unseren synthetischen Daten feinabgestimmt wurden, eine bessere Zero-Shot-Übertragung als Modelle, die nur auf überwachten Daten feinabgestimmt wurden. Code, Modelle und Daten sind verfügbar unter https://github.com/zetaalphavector/inpars.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Luiz Bonifacio

Hugo Abonizio

Marzieh Fadaee

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

InPars: Datenaugmentation für die Informationsrückgewinnung mithilfe großer Sprachmodelle

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study