What type of study is this?

This is a Quantitative Study study.

October 3, 2025Open Access

معيار أخلاقيات نماذج اللغة الكبيرة: نظام تقييم ثلاثي الأبعاد للتفكير الأخلاقي في نماذج اللغة الكبيرة

Key Points

يمكن الإطار من تحديد دقيق لنقاط القوة والضعف الأخلاقية في نماذج اللغة الكبيرة، مما يعزز توافقها الأخلاقي.
من خلال قياس التوافق مع المعايير الأخلاقية، يعالج هذا التقييم فجوات كبيرة في منهجيات التقييم الحالية.
يتم استخدام ثلاثة أبعاد للتقييم: المبادئ الأخلاقية الأساسية، صلابة الاستدلال، واتساق القيم في سيناريوهات متنوعة.
يسهم توفر مجموعات البيانات المعيارية وقاعدة شفرة التقييم بشكل علني في تعزيز التعاون لتطوير ممارسات الذكاء الاصطناعي الأخلاقية.

Abstract

تؤسس هذه الدراسة إطار عمل جديدًا لتقييم قدرات التفكير الأخلاقي لدى نماذج اللغة الكبيرة (LLMs) بشكل منهجي مع تزايد اندماجها في المجالات الاجتماعية الحيوية. تفتقر طرق التقييم الحالية إلى الدقة اللازمة لتقييم اتخاذ القرار الأخلاقي الدقيق في أنظمة الذكاء الاصطناعي، مما يخلق فجوات كبيرة في المساءلة. يعالج إطارنا هذا التحدي من خلال قياس التوافق مع المعايير الأخلاقية الإنسانية عبر ثلاثة أبعاد: المبادئ الأخلاقية الأساسية، صلابة الاستدلال، واتساق القيم عبر سيناريوهات متنوعة. تمكّن هذه الطريقة من تحديد نقاط القوة والضعف الأخلاقية في نماذج اللغة الكبيرة بدقة، مما يسهل التحسين المستهدف وتعزيز التوافق مع القيم الاجتماعية. لتعزيز الشفافية والتقدم التعاوني في تطوير الذكاء الاصطناعي الأخلاقي، نصدر علنًا مجموعات البيانات المعيارية وقاعدة شفرة التقييم على https: //github. com/ The-Responsible-AI-Initiative/LLMEthicsBenchmark. git.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Junfeng Jiao

Saleh Afroogh

Arvind R. Murali

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

معيار أخلاقيات نماذج اللغة الكبيرة: نظام تقييم ثلاثي الأبعاد للتفكير الأخلاقي في نماذج اللغة الكبيرة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider