July 1, 2024Open Access

Dr.ICL: Aprendizaje en Contexto Recuperado con Demostraciones

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

El aprendizaje en contexto (ICL), que enseña a un modelo de lenguaje grande (LLM) a realizar una tarea con pocas demostraciones en lugar de ajustar los parámetros del modelo, ha emergido como un paradigma sólido para usar LLMs. Mientras que estudios tempranos usaban principalmente un conjunto fijo o aleatorio de demostraciones para todas las consultas de prueba, investigaciones recientes sugieren que recuperar demostraciones semánticamente similares a la entrada desde un conjunto disponible de demostraciones resulta en un mejor rendimiento. Este trabajo expande la aplicabilidad de los enfoques de ICL basados en recuperación a lo largo de varias dimensiones. Extendemos el éxito del ICL basado en recuperación a LLMs afinados con instrucciones así como al prompting de Cadena de Pensamiento (CoT). Mientras trabajos previos utilizan modelos generales de lenguaje grande (LLMs), como GPT-3, encontramos que las demostraciones recuperadas también mejoran los LLMs afinados con instrucciones. Esta observación implica que los datos de entrenamiento, a pesar de haber sido expuestos durante la fase de afinamiento, pueden aún usarse efectivamente mediante recuperación y demostraciones en contexto durante la prueba, resultando en mejores resultados comparados con la no utilización de demostraciones o su selección aleatoria. Para CoT, cuando las demostraciones contienen cadenas de razonamiento, obtenemos mejoras al recuperar basándonos en dichas cadenas. Finalmente, entrenamos un recuperador de demostraciones específico para la tarea que supera a los recuperadores estándar.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Man Luo

Xin Xu

Zhuyun Dai

Journals

Data Intelligence

Actions

Institutions

Arizona State University

Google (United States)

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Dr.ICL: Aprendizaje en Contexto Recuperado con Demostraciones

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider