Autoregressive (AR) Sprachmodelle erzeugen Text tokenweise, was deren Inferenzgeschwindigkeit begrenzt. Diffusionsbasierte Sprachmodelle bieten eine vielversprechende Alternative, da sie mehrere Tokens parallel dekodieren können. Wir identifizieren jedoch einen entscheidenden Engpass bei aktuellen Diffusions-LMs: das Problem des langen Dekodierungsfensters, bei dem Tokens, die weit vom Eingangskontext entfernt generiert werden, häufig irrelevant oder repetitiv werden. Frühere Lösungen wie semi-autoregressive Modelle adressieren dieses Problem, indem sie Fenster in Blöcke aufteilen, opfern dabei jedoch Geschwindigkeit und Bidirektionalität und verlieren so den Hauptvorteil von Diffusionsmodellen. Um dies zu überwinden, schlagen wir konvolutionale Dekodierung (Conv) vor, eine auf Normalisierung basierende Methode, die das Dekodierungsfenster ohne harte Segmentierung verengt, was zu besserer Flüssigkeit und Flexibilität führt. Zusätzlich führen wir das zurückweisende regelbasierte Feintuning (R2FT) ein, ein post-hoc Trainingsverfahren, das Tokens an Positionen, die weit vom Kontext entfernt sind, besser ausrichtet. Unsere Methoden erzielen auf offen-ended Generation-Benchmarks (z.B. AlpacaEval) unter Diffusions-LM-Baselines state-of-the-art Ergebnisse bei deutlich geringerer Schrittgröße als frühere Arbeiten, was sowohl Geschwindigkeits- als auch Qualitätsverbesserungen demonstriert.
Building similarity graph...
Analyzing shared references across papers
Loading...
Young Seok Seo
Dongha Lee
Jaehyung Kim
Building similarity graph...
Analyzing shared references across papers
Loading...
Seo et al. (Thu,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68f6196ee0bbbc94fac3630e — DOI: https://doi.org/10.48550/arxiv.2509.15188
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: