October 23, 2019Open Access

Erforschung der Grenzen des Transferlernens mit einem einheitlichen Text-zu-Text-Transformer

Key Points

Key points are not available for this paper at this time.

Abstract

Transferlernen, bei dem ein Modell zunächst auf einer datenreichen Aufgabe vortrainiert und anschließend auf einer nachgelagerten Aufgabe feinabgestimmt wird, hat sich als mächtige Methode in der Verarbeitung natürlicher Sprache (NLP) etabliert. Die Effektivität des Transferlernens hat eine Vielfalt von Ansätzen und Methoden hervorgebracht. In diesem Artikel untersuchen wir die Landschaft des Transferlernens für NLP, indem wir einen einheitlichen Rahmen einführen, der alle sprachbasierten Probleme in ein Text-zu-Text-Format überführt. Unsere systematische Studie analysiert Vortrainingsziele, Architekturen, unlabeled Datensätze, Transfers und weitere Faktoren anhand dutzender Sprachverständnisaufgaben. Mit den Erkenntnissen unserer Forschung zum Einfluss der Skalierung und unserem neuen „Colossal Crawled Corpus“ erzielen wir auf vielen Benchmarks wie Zusammenfassung, Fragenbeantwortung, Textklassifikation und mehr den Stand der Technik. Für die zukünftige Forschung zum Transferlernen für NLP stellen wir unseren Datensatz, vortrainierte Modelle und den Code bereit.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Colin Raffel

Noam Shazeer

Adam Roberts

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Erforschung der Grenzen des Transferlernens mit einem einheitlichen Text-zu-Text-Transformer

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study