February 25, 2024Open Access

InstructEdit: Edición del Conocimiento basada en Instrucciones para Modelos de Lenguaje Grandes

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

La edición del conocimiento para modelos de lenguaje grandes puede ofrecer una solución eficiente para alterar el comportamiento de un modelo sin impactar negativamente el rendimiento general. Sin embargo, el enfoque actual enfrenta problemas de generalización limitada a través de tareas, requiriendo un editor distinto para cada tarea, lo que dificulta significativamente las aplicaciones más amplias. Para abordar esto, damos el primer paso para analizar el problema de generalización multitarea en la edición del conocimiento. Específicamente, desarrollamos una técnica de edición basada en instrucciones, denominada InstructEdit, que facilita la adaptación del editor a diversas tareas simultáneamente usando instrucciones simples. Con un solo editor unificado para cada LLM, demostramos empíricamente que InstructEdit puede mejorar el control del editor, logrando un aumento promedio del 14.86% en la Confiabilidad en un entorno de edición multitarea. Además, experimentos con tareas no vistas indican que InstructEdit supera constantemente a líneas base fuertes previas. Para investigar más los mecanismos subyacentes de la edición del conocimiento basada en instrucciones, analizamos los componentes principales de las direcciones del gradiente de edición, lo que revela que las instrucciones pueden ayudar a controlar la dirección de optimización con una mejor generalización OOD. El código y los conjuntos de datos estarán disponibles en https://github.com/zjunlp/EasyEdit.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Bozhong Tian

Siyuan Cheng

Xiaozhuan Liang

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

InstructEdit: Edición del Conocimiento basada en Instrucciones para Modelos de Lenguaje Grandes

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider