July 29, 2024

Comparación de LLMs utilizando un Sistema Unificado de Clasificación de Rendimiento

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Los Modelos de Lenguaje Grande (LLMs) han transformado el procesamiento del lenguaje natural y las aplicaciones impulsadas por IA. Estos avances incluyen GPT de OpenAI, LLaMA de Meta y PaLM de Google. Estos avances han ocurrido rápidamente. Encontrar una métrica común para comparar estos modelos representa una barrera sustancial para investigadores y profesionales, a pesar de su poder transformador. Esta investigación propone una novedosa métrica de clasificación de rendimiento para satisfacer la demanda urgente de un sistema de evaluación completo. Nuestra estadística compara integralmente las capacidades de los LLM combinando evaluaciones cualitativas y cuantitativas. Examinamos las ventajas y desventajas de los principales LLMs mediante un análisis exhaustivo, proporcionando información valiosa sobre cómo se comparan en rendimiento. Este proyecto tiene como objetivo avanzar en el desarrollo de modelos de lenguaje más confiables y efectivos y facilitar la toma de decisiones informadas al elegir modelos.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

M Hernàndez Leòn

Journals

International Journal of Artificial Intelligence & Applications

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Comparación de LLMs utilizando un Sistema Unificado de Clasificación de Rendimiento

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study