تقدم هذه الورقة تحقيقًا استكشافيًا عبر المجالات في نمط فشل متكرر في استدلال الذكاء الاصطناعي: ميله لإنتاج إجابات تبدو كفء على السطح داخل أُطُر غير مدققة بدلاً من تدقيق الإطار ذاته. عبر اختبارات الضغط التكرارية البشرية-الذكاء الاصطناعي في سيناريوهات جيوسياسية وشخصية وعملية وحدود السلامة وتشكيل الانتباه، ظهر نفس النمط مرارًا وتكرارًا. غالبًا ما يبدأ النظام التحليل متأخرًا في سلسلة السببية، يدمج المسؤوليات الطبقية إلى لوم مبسط، يقلل من وزن المتغيرات الخفية، ويعامل الأخلاقيات والبقاء كأمور ثانوية مقارنة بإكمال المهمة المحلية. تحسن جودة الاستدلال بشكل كبير عندما دفع النظام لإعادة بناء السببية المنبع، المحافظة على التفاصيل السياقية، التمييز بين الحقيقة والاستدلال، نمذجة الواقع العاطفي والاجتماعي كمتغيرات سببية، وفحص ما إذا كان الإطار ذاته يشوه المشكلة. تجادل الورقة بأن هذا الفشل ليس خاصًا بمجال معين. بل يعكس ضعفًا أعمق في بنية الاستدلال: يمكن للأنظمة القوية أن تكون مفيدة محليًا لكنها مضللة عالميًا إذا عملت ضمن أُطُر سببية سيئة. الادعاء المركزي هو أن المرحلة القادمة من تقييم الذكاء الاصطناعي يجب ألا تركز فقط على الصحة الواقعية أو الامتثال أو أداء السلامة الضيق، بل أيضًا على قدرة النظام على كشف البدايات الخاطئة، ورسم المسؤولية الطبقية، ومقاومة تسطيح السرد، والاستدلال بطرق تتوافق مع البقاء المشترك.
Building similarity graph...
Analyzing shared references across papers
Loading...
Samanta Figueiredo
Building similarity graph...
Analyzing shared references across papers
Loading...
درس سامانتا فيغيريدو (الأربعاء) هذا السؤال.
www.synapsesocial.com/papers/69be38ca6e48c4981c67972e — DOI: https://doi.org/10.5281/zenodo.19097764
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: