April 15, 2024Open Access

بناء معايير وتدخلات لمكافحة الهلوسة في نماذج اللغة الكبرى (LLMs)

Key Points

Key points are not available for this paper at this time.

Abstract

نماذج اللغة الكبرى (LLMs) عرضة للهلوسة، مما أثار جهدًا واسع النطاق لاكتشافها ومنعها. تحاول الأعمال الحديثة التخفيف من الهلوسات بالتدخل في حسابات النموذج أثناء التوليد، باستخدام إعدادات وخوارزميات مختلفة. تفتقر هذه الأعمال إلى الفصل بين أسباب الهلوسة المختلفة. في هذا العمل، نقدم أولاً منهجًا لبناء مجموعات بيانات تعتمد على معرفة النموذج لطرق الكشف والتدخل في سياقات الأسئلة والأجوبة المغلقة والمفتوحة. ثم نصف تأثير الخيارات المختلفة للتدخل، مثل المكونات المتداخلة (MLPs، كتلة الانتباه، تدفق الباقي، والرؤوس المحددة)، ومدى تواتر وقوة التدخل. نجد أن نجاح التدخل يختلف حسب المكون، مع وجود بعض المكونات التي تضر بقدرات نمذجة اللغة. أخيرًا، نلاحظ أن التدخلات يمكن أن تستفيد من توجيه قبل الهلوسة بدلاً من بعد الهلوسة. الكود متاح على https://github.com/technion-cs-nlp/hallucination-mitigation

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Adi Simhi

Jonathan Herzig

Idan Szpektor

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

بناء معايير وتدخلات لمكافحة الهلوسة في نماذج اللغة الكبرى (LLMs)

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider