February 27, 2023Open Access

LLaMA: Modelos de Linguagem Fundamentais Abertos e Eficientes

Key Points

Key points are not available for this paper at this time.

Abstract

Apresentamos o LLaMA, uma coleção de modelos de linguagem fundamentais que variam de 7B a 65B parâmetros. Treinamos nossos modelos com trilhões de tokens e mostramos que é possível treinar modelos de última geração usando exclusivamente conjuntos de dados publicamente disponíveis, sem recorrer a conjuntos de dados proprietários e inacessíveis. Em particular, o LLaMA-13B supera o GPT-3 (175B) na maioria dos benchmarks, e o LLaMA-65B é competitivo com os melhores modelos, Chinchilla-70B e PaLM-540B. Liberamos todos os nossos modelos para a comunidade de pesquisa.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Hugo Touvron

Thibaut Lavril

Gautier Izacard

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

LLaMA: Modelos de Linguagem Fundamentais Abertos e Eficientes

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study