What question did this study set out to answer?

عرض بنية وتنفيذ نظام جدالي متعدد النماذج باستخدام نماذج اللغة الكبيرة (LLMs).

March 22, 2026Open Access

مجلس الذكاء الاصطناعي متعدد النماذج: البنية والتنفيذ لأنظمة الجدل التكراري بين نماذج اللغة الكبيرة

Key Points

عرض بنية وتنفيذ نظام جدالي متعدد النماذج باستخدام نماذج اللغة الكبيرة (LLMs).
تم تطوير نظام جدال على خادم Node.js مع SQLite لاستمرارية البيانات.
دمج وتنظيم مناقشات بين 3-8 نماذج لغة كبيرة من خلال جولات جدالية منظمة.
تحليل آلية انتقال الحالة وتحديد أوضاع الفشل خلال التفاعلات.
الجولات الجدالية المتعددة قللت من معدلات الهلوسة مقارنة بمخرجات النموذج الفردي.
أشارت ملاحظات 14 جلسة إلى أن المخرجات تم تقييمها أفضل من ردود النماذج الفردية.

Abstract

تقدم هذه الورقة بنية وتنفيذ وتحليلًا تجريبيًا لـ AI Consilium — نظام جدال إنتاجي متعدد النماذج ينظم مناقشات تكرارية بين 3-8 نماذج لغة كبيرة من خلال جولات منظمة من التفكير المستقل، والنقد بين النماذج، والتوليف. يعمل النظام على خادم Node.js/Express مخصص مع استمرارية SQLite، مدمجًا 8 واجهات برمجة تطبيقات تجارية لنماذج اللغة الكبيرة. نوثق آلية انتقال الحالة بين الجولات، نحلل توسع تكلفة الرموز، نحدد أوضاع الفشل، ونقدم أول نتائج تدقيق ReIQ (مؤشر الذكاء التناسخي) عبر النماذج. تظهر بيانات الإنتاج من 14 جلسة أن الجدل متعدد الجولات يقلل معدلات الهلوسة وينتج مخرجات قابلة للتنفيذ يتم تقييمها أعلى من ردود النموذج الفردي. الإصدار 2.0 — مراجَع حسب معيار Diamond Standard (هيكل أكاديمي مكون من 30 قسمًا). تمت المراجعة من قبل مجلس ذكاء اصطناعي متعدد النماذج.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Maris Dreshmanis

Actions

Institutions

Swiss Academy of Sciences

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

مجلس الذكاء الاصطناعي متعدد النماذج: البنية والتنفيذ لأنظمة الجدل التكراري بين نماذج اللغة الكبيرة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider