What type of study is this?

This is a Experimental Study study.

October 20, 2025Open Access

Modelos de Lenguaje de Difusión Rápidos y Fluidez a través de Decodificación por Convolución y Ajuste Fino Rechazante

Puntos clave

El estudio demuestra mejoras significativas en fluidez y flexibilidad para la generación de lenguaje.
La decodificación por convolución estrecha las ventanas de decodificación, abordando la relevancia de los tokens generados.
El ajuste fino rechazante alinea mejor los tokens, optimizando las dependencias a largo plazo en el texto generado.
Los resultados indican un rendimiento de última generación en benchmarks de generación abierta con mayor eficiencia.

Resumen

Los modelos de lenguaje autorregresivos (AR) generan texto un token a la vez, lo que limita su velocidad de inferencia. Los modelos de lenguaje basados en difusión ofrecen una alternativa prometedora, ya que pueden decodificar múltiples tokens en paralelo. Sin embargo, identificamos un cuello de botella clave en los modelos de difusión actuales: el problema de la ventana de decodificación larga, donde los tokens generados lejos del contexto de entrada con frecuencia se vuelven irrelevantes o repetitivos. Soluciones previas como el semi-autorregresivo abordan este problema dividiendo las ventanas en bloques, pero esto sacrifica velocidad y bidireccionalidad, eliminando la principal ventaja de los modelos de difusión. Para superarlo, proponemos la decodificación por convolución (Conv), un método basado en normalización que estrecha la ventana de decodificación sin segmentación rígida, lo que conduce a mejor fluidez y flexibilidad. Además, introducimos el Ajuste Fino Basado en Reglas de Rechazo (R2FT), un esquema de entrenamiento post-hoc que alinea mejor los tokens en posiciones alejadas del contexto. Nuestros métodos logran resultados de última generación en benchmarks de generación abierta (p. ej., AlpacaEval) entre las bases de modelos de difusión, con un tamaño de paso significativamente menor que trabajos anteriores, demostrando mejoras tanto en velocidad como en calidad.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Young Seok Seo

Dongha Lee

Jaehyung Kim

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Modelos de Lenguaje de Difusión Rápidos y Fluidez a través de Decodificación por Convolución y Ajuste Fino Rechazante

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider