January 1, 2023Open Access

Lente do Futuro: Antecipando Tokens Subsequentes a partir de um Único Estado Oculto

Key Points

Key points are not available for this paper at this time.

Abstract

Hipotetizamos que vetores de estado oculto correspondentes a tokens de entrada individuais codificam informações suficientes para prever com precisão vários tokens à frente. Mais concretamente, neste artigo perguntamos: dado uma representação oculta (interna) de um único token na posição t de uma entrada, podemos antecipar de forma confiável os tokens que aparecerão nas posições ≥ t + 2? Para testar isso, medimos métodos de aproximação linear e intervenção causal no GPT-J-6B para avaliar o grau em que estados ocultos individuais na rede contêm sinal suficientemente rico para prever estados ocultos futuros e, finalmente, saídas de tokens. Constatamos que, em algumas camadas, podemos aproximar a saída do modelo com mais de 48% de precisão em relação à sua previsão dos tokens subsequentes por meio de um único estado oculto. Finalmente, apresentamos uma visualização "Lente do Futuro" que usa esses métodos para criar uma nova visão dos estados do transformador.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Koyena Pal

Jiuding Sun

Andrew C. Yuan

Actions

Institutions

University of Massachusetts Amherst

Universidad del Noreste

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Lente do Futuro: Antecipando Tokens Subsequentes a partir de um Único Estado Oculto

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider