Key points are not available for this paper at this time.
تمدد هذه الورقة التحقيقات الحديثة حول قدرات الاستدلال العاطفي لنماذج اللغة الكبيرة (LLMs). الأبحاث الحالية حول LLMs لم تقم بتقييم مباشر للتمييز بين كيف تتنبأ هذه النماذج بالنسبة الذاتية للعواطف وكيف تدرك عواطف الآخرين. ننظر أولاً إلى محفزات عاطفية مصممة بعناية، صُممت أصلاً لاكتشاف أنماط نشاط الأعصاب الدماغية التي تمثل نسبًا عاطفية دقيقة مستنتجة للآخرين. نُظهر أن GPT-4 دقيق بشكل خاص في الاستدلال حول هذه المحفزات. هذا يشير إلى أن نماذج اللغة الكبيرة تتفق مع نسب البشر لعواطف الآخرين في سيناريوهات نمطية أكثر بكثير من نسب الذات للعواطف في حالات فردية مميزة. لاستكشاف ذلك أكثر، تستخدم دراستنا الثانية مجموعة بيانات تحتوي على تعليقات من المؤلف ومن منظور شخص ثالث. نجد أن تفسيرات GPT-4 تتوافق أكثر مع أحكام البشر حول عواطف الآخرين مقارنة بالتقييمات الذاتية. من الجدير بالذكر أن النماذج الحسابية التقليدية للعاطفة تعتمد بشكل أساسي على تقارير ذاتية كمعيار ذهبي. ومع ذلك، قد يكون موقف المراقب المتوسط، الذي يبدو أن نماذج اللغة الكبيرة تبنته، أكثر صلة للعديد من التطبيقات اللاحقة، على الأقل في غياب معلومات فردية واعتبارات أمان كافية.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ala N. Tak
Jonathan Gratch
Building similarity graph...
Analyzing shared references across papers
Loading...
درس تاك وآخرون (السبت) هذا السؤال.
www.synapsesocial.com/papers/68e5cc78b6db6435875634bd — DOI: https://doi.org/10.48550/arxiv.2408.13718
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: