Los puntos clave no están disponibles para este artículo en este momento.
Los grandes modelos de lenguaje (LLMs) son susceptibles a alucinaciones, lo que ha generado un esfuerzo generalizado para detectarlas y prevenirlas. Trabajos recientes intentan mitigar las alucinaciones interviniendo en el cálculo del modelo durante la generación, utilizando diferentes configuraciones y heurísticas. Estos trabajos carecen de separación entre las distintas causas de alucinación. En este trabajo, primero presentamos un enfoque para construir conjuntos de datos basados en el conocimiento del modelo para métodos de detección e intervención en escenarios de preguntas y respuestas con y sin consulta externa. Luego caracterizamos el efecto de diferentes elecciones para la intervención, como los componentes intervenidos (MLPs, bloque de atención, flujo residual y cabezas específicas), y con qué frecuencia y qué intensidad intervenir. Encontramos que el éxito de la intervención varía según el componente, siendo algunos componentes perjudiciales para las capacidades de modelado de lenguaje. Finalmente, encontramos que las intervenciones pueden beneficiarse de una dirección de ajuste previa a la alucinación en lugar de una posterior. El código está disponible en https://github.com/technion-cs-nlp/hallucination-mitigation
Building similarity graph...
Analyzing shared references across papers
Loading...
Adi Simhi
Jonathan Herzig
Idan Szpektor
Building similarity graph...
Analyzing shared references across papers
Loading...
Simhi et al. (Mon,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e6f2aeb6db64358766db85 — DOI: https://doi.org/10.48550/arxiv.2404.09971
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: