What type of study is this?

This is a Experimental Study study.

October 20, 2025Open Access

Schnelle und flüssige Diffusions-Sprachmodelle durch konvolutionale Dekodierung und zurückweisendes Feintuning

Key Points

Die Studie zeigt signifikante Verbesserungen in Flüssigkeit und Flexibilität der Sprachgenerierung.
Konvolutionale Dekodierung verengt Dekodierungsfenster und adressiert die Relevanz generierter Tokens.
Zurückweisendes Feintuning richtet Tokens besser aus und optimiert langreichweitige Abhängigkeiten im generierten Text.
Ergebnisse zeigen state-of-the-art Leistung auf Benchmarks für offene Textgenerierung mit höherer Effizienz.

Abstract

Autoregressive (AR) Sprachmodelle erzeugen Text tokenweise, was deren Inferenzgeschwindigkeit begrenzt. Diffusionsbasierte Sprachmodelle bieten eine vielversprechende Alternative, da sie mehrere Tokens parallel dekodieren können. Wir identifizieren jedoch einen entscheidenden Engpass bei aktuellen Diffusions-LMs: das Problem des langen Dekodierungsfensters, bei dem Tokens, die weit vom Eingangskontext entfernt generiert werden, häufig irrelevant oder repetitiv werden. Frühere Lösungen wie semi-autoregressive Modelle adressieren dieses Problem, indem sie Fenster in Blöcke aufteilen, opfern dabei jedoch Geschwindigkeit und Bidirektionalität und verlieren so den Hauptvorteil von Diffusionsmodellen. Um dies zu überwinden, schlagen wir konvolutionale Dekodierung (Conv) vor, eine auf Normalisierung basierende Methode, die das Dekodierungsfenster ohne harte Segmentierung verengt, was zu besserer Flüssigkeit und Flexibilität führt. Zusätzlich führen wir das zurückweisende regelbasierte Feintuning (R2FT) ein, ein post-hoc Trainingsverfahren, das Tokens an Positionen, die weit vom Kontext entfernt sind, besser ausrichtet. Unsere Methoden erzielen auf offen-ended Generation-Benchmarks (z.B. AlpacaEval) unter Diffusions-LM-Baselines state-of-the-art Ergebnisse bei deutlich geringerer Schrittgröße als frühere Arbeiten, was sowohl Geschwindigkeits- als auch Qualitätsverbesserungen demonstriert.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Young Seok Seo

Dongha Lee

Jaehyung Kim

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Schnelle und flüssige Diffusions-Sprachmodelle durch konvolutionale Dekodierung und zurückweisendes Feintuning

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider