What type of study is this?

This is a Experimental Study study.

October 10, 2025Open Access

Difusões mascaradas auto-especulativas

Key Points

O novo método alcança uma redução de aproximadamente 2x nas passagens diretas da rede comparado a modelos padrão.
Modificando a máscara de atenção do transformer, previsões não-fatoradas podem ser geradas de forma eficaz.
O mecanismo de amostragem especulativa permite a geração de tokens provisórios que aumenta a eficiência.
Esta abordagem pode ser aplicada à modelagem de texto e geração de sequências de proteínas, melhorando significativamente a eficiência computacional.

Abstract

Apresentamos difusões mascaradas auto-especulativas, uma nova classe de modelos generativos de difusão mascarada para dados discretos que exigem significativamente menos avaliações da função para gerar amostras. Modelos padrão de difusão mascarada prevêem logits fatorados sobre posições atualmente mascaradas. Um número de posições mascaradas é então amostrado; entretanto, a aproximação fatorada significa que amostrar muitas posições de uma vez leva a baixa qualidade da amostra. Como resultado, muitos passos de simulação e, portanto, avaliações da função da rede neural, são necessários para gerar dados de alta qualidade. Reduzimos a carga computacional gerando previsões não-fatoradas sobre posições mascaradas. Isso é alcançado modificando a máscara final de atenção do transformer de não-causal para causal, permitindo a geração de tokens provisórios e validação paralela por meio de um novo mecanismo especulativo integrado ao modelo para amostragem. Isso resulta em uma distribuição preditiva não-fatorada sobre posições mascaradas em uma única passagem direta. Aplicamos nosso método à modelagem de texto na escala GPT2 e geração de sequências proteicas, constatando que podemos alcançar uma redução aproximada de 2x no número requerido de passagens diretas da rede em relação aos modelos padrão de difusão mascarada.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Andrew Campbell

Valentin De Bortoli

Jiaxin Shi

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Difusões mascaradas auto-especulativas

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider