Los puntos clave no están disponibles para este artículo en este momento.
Conceptualizamos el proceso de comprensión como compresión de información y proponemos un método para clasificar grandes modelos de lenguaje (LLMs) basándonos en la compresión de datos sin pérdida. Demostramos la equivalencia de la longitud de compresión bajo codificación aritmética con la suma acumulada de logaritmos negativos de probabilidades al usar un gran modelo de lenguaje como priori; es decir, la fase de preentrenamiento del modelo es esencialmente el proceso de aprender la longitud óptima de codificación. Al mismo tiempo, la métrica de evaluación ratio de compresión se puede obtener sin compresión real, lo cual ahorra significativamente los costos. En este artículo, usamos cinco grandes modelos de lenguaje como prioritarios para la compresión, y luego comparamos su desempeño en tareas complejas de procesamiento de lenguaje natural, incluyendo completado de oraciones, respuesta a preguntas y resolución de correferencia. Los resultados experimentales muestran que el ratio de compresión y el desempeño del modelo están positivamente correlacionados, por lo que puede usarse como una métrica general para evaluar grandes modelos de lenguaje.
Building similarity graph...
Analyzing shared references across papers
Loading...
Peijia Guo
Ziguang Li
Haibo Hu
Building similarity graph...
Analyzing shared references across papers
Loading...
Guo et al. (jue,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e6404bb6db6435875d20a6 — DOI: https://doi.org/10.48550/arxiv.2406.14171
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: