Los puntos clave no están disponibles para este artículo en este momento.
Recientes modelos de lenguaje fundamentales han mostrado un rendimiento de última generación en muchas tareas de PLN en configuraciones de cero y pocos ejemplos. Una ventaja de estos modelos sobre los enfoques más estándar basados en ajuste fino es la capacidad para entender instrucciones escritas en lenguaje natural (prompts), lo que les ayuda a generalizar mejor a diferentes tareas y dominios sin la necesidad de datos de entrenamiento específicos. Esto los hace adecuados para abordar problemas de clasificación de texto en dominios con cantidades limitadas de instancias anotadas. Sin embargo, la investigación existente es limitada en escala y carece de comprensión sobre cómo los modelos de generación de texto combinados con técnicas de prompting se comparan con métodos más establecidos para la clasificación de texto, como el ajuste fino de modelos de lenguaje enmascarados. En este trabajo, abordamos esta brecha mediante un estudio de evaluación a gran escala con 16 conjuntos de datos de clasificación de texto que cubren problemas binarios, multiclase y multilabel. En particular, comparamos los enfoques de cero y pocos ejemplos de grandes modelos de lenguaje con el ajuste fino de modelos de lenguaje más pequeños. También analizamos los resultados por prompt, tipo de clasificación, dominio y número de etiquetas. En general, los resultados muestran cómo el ajuste fino de modelos de lenguaje más pequeños y eficientes aún puede superar los enfoques de pocos ejemplos de modelos de lenguaje más grandes, los cuales tienen espacio para mejorar en lo que respecta a la clasificación de texto.
Building similarity graph...
Analyzing shared references across papers
Loading...
Aleksandra Edwards
José Camacho-Collados
Building similarity graph...
Analyzing shared references across papers
Loading...
Edwards et al. (mar) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e72435b6db64358769e044 — DOI: https://doi.org/10.48550/arxiv.2403.17661
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: