यह पेपर कृत्रिम बुद्धिमत्ता (AI) के क्षेत्र में एक सैद्धांतिक जांच प्रस्तुत करता है, जिसका उद्देश्य उन सीमाओं को परिभाषित करना है जिनके अंतर्गत एक AI प्रणाली अपनी सौम्य प्रकृति बनाए रखती है। इन सीमाओं का आकलन AI अलाइनमेंट प्रतिबंधों के सेट को एकत्रित करके किया गया है, जो एल्गोरिदमिक सिद्धांतों और सामाजिक शक्ति वितरण से प्राप्त होते हैं। इन विविध प्रकृतियों के कारण, तुलनात्मकता सुनिश्चित करने के लिए एक प्रॉक्सी माप का उपयोग किया गया है। संज्ञानात्मक कार्य जटिलता को मानकीकरण मीट्रिक के रूप में चुना गया है, जो विभिन्न क्षेत्रों को एकीकृत पैमाने पर मानचित्रित करता है। विश्लेषण में एल्गोरिदमिक तकनीकों को शामिल किया गया है जो अलाइनमेंट प्राप्त करने की कोशिश करती हैं। यह दिखाता है कि ये सुरक्षित AI संचालन की संभावना रखते हैं। इसके अतिरिक्त, विश्लेषण यह भी दर्शाता है कि AI अलाइनमेंट की सीमाएँ एक विशेष डेटा पैटर्न का गठन करती हैं, जिसे नियमित और प्रत्यर्पित किया जा सकता है। परिणामस्वरूप, बेहतर अलाइनमेंट के लिए एक मानदंड प्रस्तावित किया गया है, जो एक नई AI अलाइनमेंट श्रेणी का सृजन करता है, जो सभी वास्तविक संज्ञानात्मक कार्यों में असफलता-सुरक्षा (fail-safety) से युक्त है। इस अलाइनमेंट वर्ग को लागू करने के लिए एक एल्गोरिदमिक विशेषता भी प्रस्तावित की गई है, जो AI सुरक्षा और अलाइनमेंट अनुसंधान के विकास में योगदान देती है।
Building similarity graph...
Analyzing shared references across papers
Loading...
Konstantyn Spasokukotskiy
Building similarity graph...
Analyzing shared references across papers
Loading...
Konstantyn Spasokukotskiy (बुधवार) ने इस प्रश्न का अध्ययन किया।
www.synapsesocial.com/papers/68c189ca9b7b07f3a0612ea6 — DOI: https://doi.org/10.22541/au.171697103.39692698/v2
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: