Key points are not available for this paper at this time.
L'augmentation de la taille des modèles de langage a démontré une amélioration prévisible des performances et de l'efficacité d'échantillonnage sur un large éventail de tâches en aval. Cet article traite plutôt d'un phénomène imprévisible que nous appelons capacités émergentes des grands modèles de langage. Nous considérons qu'une capacité est émergente si elle n'est pas présente dans les modèles plus petits mais qu'elle apparaît dans les modèles plus grands. Ainsi, les capacités émergentes ne peuvent pas être prédites simplement en extrapolant les performances des modèles plus petits. L'existence de cette émergence implique qu'une augmentation supplémentaire de la taille pourrait élargir encore la gamme des capacités des modèles de langage.
Building similarity graph...
Analyzing shared references across papers
Loading...
Jason Lee
Yi Tay
Rishi Bommasani
Building similarity graph...
Analyzing shared references across papers
Loading...
Lee et al. (mercredi) ont étudié cette question.
www.synapsesocial.com/papers/69d87cd833ca018b39ae3a4e — DOI: https://doi.org/10.48550/arxiv.2206.07682