February 26, 2024Open Access

الخلايا العصبية الخاصة باللغة: المفتاح للقدرات متعددة اللغات في نماذج اللغة الكبيرة

Key Points

Key points are not available for this paper at this time.

Abstract

تُظهر نماذج اللغة الكبيرة (LLMs) قدرات متعددة اللغات مذهلة دون أن تكون مُدربة مسبقًا على مجموعات موازية متعددة اللغات مُنقحة خصيصًا. لا يزال من التحديات تفسير الآليات التي تعالج بها نماذج اللغة الكبيرة النصوص متعددة اللغات. في هذه الورقة، نتعمق في تكوين هياكل Transformer داخل LLMs لتحديد المناطق الخاصة بكل لغة. وبشكل خاص، نقترح طريقة استكشاف جديدة، تسمى انتروبي احتمال تنشيط اللغة (LAPE)، لتحديد الخلايا العصبية الخاصة باللغة ضمن نماذج اللغة الكبيرة. استنادًا إلى LAPE، أجرينا تجارب شاملة على نموذجين تمثيليين من LLMs، وهما LLaMA-2 وBLOOM. تشير نتائجنا إلى أن كفاءة نماذج اللغة الكبيرة في معالجة لغة معينة تعود بشكل أساسي إلى مجموعة صغيرة من الخلايا العصبية، تقع أساسًا في الطبقات العليا والسفلى للنماذج. علاوة على ذلك، نُظهر إمكانية "توجيه" لغة المخرجات لنماذج اللغة الكبيرة من خلال تنشيط أو تعطيل محدد للخلايا العصبية الخاصة باللغة. توفر أبحاثنا أدلة مهمة لفهم واستكشاف القدرات متعددة اللغات لنماذج اللغة الكبيرة.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

درس تانغ وآخرون (Mon,) هذا السؤال.

www.synapsesocial.com/papers/68e779e4b6db6435876ee86c — DOI: https://doi.org/10.48550/arxiv.2402.16438

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Authors

Tianyi Tang

Wenyang Luo

Haoyang Huang

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

الخلايا العصبية الخاصة باللغة: المفتاح للقدرات متعددة اللغات في نماذج اللغة الكبيرة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion