Los puntos clave no están disponibles para este artículo en este momento.
Los Modelos de Lenguaje Grande (LLMs) han transformado el procesamiento del lenguaje natural y las aplicaciones impulsadas por IA. Estos avances incluyen GPT de OpenAI, LLaMA de Meta y PaLM de Google. Estos avances han ocurrido rápidamente. Encontrar una métrica común para comparar estos modelos representa una barrera sustancial para investigadores y profesionales, a pesar de su poder transformador. Esta investigación propone una novedosa métrica de clasificación de rendimiento para satisfacer la demanda urgente de un sistema de evaluación completo. Nuestra estadística compara integralmente las capacidades de los LLM combinando evaluaciones cualitativas y cuantitativas. Examinamos las ventajas y desventajas de los principales LLMs mediante un análisis exhaustivo, proporcionando información valiosa sobre cómo se comparan en rendimiento. Este proyecto tiene como objetivo avanzar en el desarrollo de modelos de lenguaje más confiables y efectivos y facilitar la toma de decisiones informadas al elegir modelos.
Building similarity graph...
Analyzing shared references across papers
Loading...
M Hernàndez Leòn
International Journal of Artificial Intelligence & Applications
Building similarity graph...
Analyzing shared references across papers
Loading...
M Hernàndez Leòn (Mon,) estudió esta cuestión.
www.synapsesocial.com/papers/68e5ea48b6db64358757f706 — DOI: https://doi.org/10.5121/ijaia.2024.15403