مكنت التطورات الحديثة في نماذج اللغة الكبيرة (LLMs) من إجراء محاكاة اجتماعية تشبه الإنسان بمقاييس ودقة غير مسبوقة، مما يوفر فرصًا جديدة لعلم الاجتماع الحاسوبي. ومع ذلك، فإن التحدي الرئيسي هو بناء مجموعات شخصيات تمثل بشكل حقيقي تنوع وتوزيع السكان في العالم الحقيقي. تركز معظم الدراسات الحالية التي تعتمد على نماذج اللغة الكبيرة في المحاكاة الاجتماعية بشكل أساسي على تصميم أطر وكالات وبيئات المحاكاة، متجاهلة غالبًا تعقيدات توليد الشخصيات والتحيزات المحتملة التي قد تنتج عن مجموعات شخصيات غير تمثيلية. في هذه الورقة، نقترح إطارًا منهجيًا لتوليف مجموعات شخصيات ذات جودة عالية ومتوافقة مع السكان لمحاكاة اجتماعية مدفوعة بـ LLM. يبدأ منهجنا باستخدام نماذج اللغة الكبيرة لتوليد شخصيات سردية من بيانات وسائل التواصل الاجتماعي طويلة الأمد، يلي ذلك تقييم دقيق للجودة لتصفية الملفات غير الدقيقة. ثم نطبق أخذ العينات بالأهمية لتحقيق التوافق العالمي مع توزيعات نفسية مرجعية، مثل سمات الشخصية الخمسة الكبرى. لمعالجة احتياجات سياقات المحاكاة الخاصة، نقدم أيضًا وحدة مخصصة مهمة لتكييف مجموعة الشخصيات المتوافقة عالميًا مع الفئات الفرعية المستهدفة. تظهر تجارب واسعة أن طريقتنا تقلل بشكل كبير من الانحياز على مستوى السكان وتمكن من محاكاة اجتماعية دقيقة ومرنة لمجموعة واسعة من التطبيقات البحثية والسياسية.
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhengyu Hu
Zheyuan Xiao
Ming Xiong
Building similarity graph...
Analyzing shared references across papers
Loading...
درس هوا وآخرون (الجمعة) هذا السؤال.
www.synapsesocial.com/papers/68dc1e358a7d58c25ebb1696 — DOI: https://doi.org/10.48550/arxiv.2509.10127