July 9, 2024Open Access

العقول الافتراضية: نظرية دعم العقل لمهام متعددة الوكلاء باستخدام نماذج اللغة الكبيرة

Key Points

Key points are not available for this paper at this time.

Abstract

تواجه طرق التعلم التعزيزي متعددة الوكلاء (MARL) صعوبات بسبب عدم الاستقرار في أنظمة متعددة الوكلاء وتفشل في التعلم التكيفي عبر الإنترنت عند اختبارها مع وكلاء جدد. هنا، نستفيد من نماذج اللغة الكبيرة (LLMs) لإنشاء وكيل مستقل يمكنه التعامل مع هذه التحديات. يتكون وكيلنا، العقول الافتراضية، من بنية مستوحاة معرفيًا، تضم مكونات معيارية للإدراك والذاكرة والتخطيط الهرمي على مستويين من التجريد. نقدم وحدة نظرية العقل التي تدعم عملية التخطيط عالية المستوى عن طريق توليد فرضيات حول استراتيجيات الوكلاء الآخرين بلغة طبيعية. ثم تقوم بتقييم هذه الفرضيات وتنقيحها تدريجيًا من خلال تعزيز الفرضيات التي تتنبأ بشكل صحيح بسلوك الوكلاء الآخرين. تُحسن العقول الافتراضية الأداء بشكل كبير مقارنةً بأساسيات وكلاء LLM وRL السابقة في مجموعة من المجالات التنافسية، المختلطة الدوافع، والتعاونية في معيار Melting Pot، بما في ذلك البيئات الثنائية والسكانية. بالإضافة إلى ذلك، تكشف المقارنات مع أساسيات وكلاء LLM والتحليلات المُقصية أهمية تقييم الفرضيات وتنقيحها للنجاح في السيناريوهات المعقدة.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Logan Cross

Violet Xiang

Agam Bhatia

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

العقول الافتراضية: نظرية دعم العقل لمهام متعددة الوكلاء باستخدام نماذج اللغة الكبيرة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider