تقدم هذه الورقة بنية وتنفيذ وتحليلًا تجريبيًا لـ AI Consilium — نظام جدال إنتاجي متعدد النماذج ينظم مناقشات تكرارية بين 3-8 نماذج لغة كبيرة من خلال جولات منظمة من التفكير المستقل، والنقد بين النماذج، والتوليف. يعمل النظام على خادم Node.js/Express مخصص مع استمرارية SQLite، مدمجًا 8 واجهات برمجة تطبيقات تجارية لنماذج اللغة الكبيرة. نوثق آلية انتقال الحالة بين الجولات، نحلل توسع تكلفة الرموز، نحدد أوضاع الفشل، ونقدم أول نتائج تدقيق ReIQ (مؤشر الذكاء التناسخي) عبر النماذج. تظهر بيانات الإنتاج من 14 جلسة أن الجدل متعدد الجولات يقلل معدلات الهلوسة وينتج مخرجات قابلة للتنفيذ يتم تقييمها أعلى من ردود النموذج الفردي. الإصدار 2.0 — مراجَع حسب معيار Diamond Standard (هيكل أكاديمي مكون من 30 قسمًا). تمت المراجعة من قبل مجلس ذكاء اصطناعي متعدد النماذج.
Building similarity graph...
Analyzing shared references across papers
Loading...
Maris Dreshmanis
Swiss Academy of Sciences
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Maris Dreshmanis (Sat,) هذا السؤال.
www.synapsesocial.com/papers/69bf390ac7b3c90b18b433de — DOI: https://doi.org/10.5281/zenodo.19140868
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: