Key points are not available for this paper at this time.
Synthetisierte Daten aus generativen Modellen werden zunehmend als Alternative zu von Menschen annotierten Daten für das Fine-Tuning großer Sprachmodelle betrachtet. Dies wirft Bedenken bezüglich des Modellkollapses auf: ein Leistungsabfall bei Modellen, die auf generierten Daten feinabgestimmt wurden. Da es für Menschen und Maschinen einfacher ist, zwischen guten und schlechten Beispielen zu unterscheiden als hochwertige Stichproben zu erzeugen, untersuchen wir den Einsatz von Feedback zu synthetisierten Daten zur Vermeidung von Modellkollaps. Wir leiten theoretische Bedingungen ab, unter denen ein Gaußsches Mischklassifikationsmodell asymptotisch optimale Leistung erreichen kann, wenn es auf feedback-augmentierten synthetisierten Daten trainiert wird, und liefern unterstützende Simulationen für endliche Regime. Unsere theoretischen Vorhersagen veranschaulichen wir anhand von zwei praktischen Problemen: der Berechnung von Matrixeigenwerten mit Transformern und der Zusammenfassung von Nachrichten mit großen Sprachmodellen, die beide bei Training auf modellgenerierten Daten Modellkollaps erfahren. Wir zeigen, dass Training mit feedback-augmentierten synthetisierten Daten, entweder durch das Entfernen falscher Vorhersagen oder durch Auswahl der besten von mehreren Vermutungen, Modellkollaps verhindern kann, womit beliebte Ansätze wie RLHF validiert werden.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yunzhen Feng
Elvis Dohmatob
Pu Yang
Building similarity graph...
Analyzing shared references across papers
Loading...
Feng et al. (Tue,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68e6542bb6db6435875e3124 — DOI: https://doi.org/10.48550/arxiv.2406.07515
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: