Key points are not available for this paper at this time.
भाषा मॉडल (LMs) उन दस्तावेज़ों के संग्रह पर प्रशिक्षित होते हैं, जिन्हें व्यक्तिगत मानव एजेंटों द्वारा बाहरी दुनिया में विशिष्ट उद्देश्यों को प्राप्त करने के लिए लिखा गया है। प्रशिक्षण के दौरान, LMs के पास केवल इन दस्तावेज़ों के पाठ तक पहुंच होती है, उन एजेंटों की आंतरिक अवस्थाओं के सीधे प्रमाण तक नहीं, जिन्होंने इन्हें बनाया — यह तथ्य अक्सर यह तर्क देने के लिए उपयोग किया जाता है कि LMs मानव भाषा उत्पादन और समझ के लक्ष्य-निर्दिष्ट पहलुओं को मॉडल करने में असमर्थ हैं। क्या पाठ पर प्रशिक्षित LMs भाषा और उपयोग के बीच संबंध के बारे में कुछ भी सीख सकते हैं? मैं तर्क देता हूं कि LMs संचारात्मक इरादों के मॉडल हैं, एक विशिष्ट, संकीर्ण अर्थ में। जब एक पाठ संदर्भ दिए जाने पर अगला शब्द अनुमानित किया जाता है, तो एक LM उस एजेंट की विशेषताओं को अनुमानित और प्रदर्शित कर सकता है, जिसने संभवतः वह संदर्भ उत्पन्न किया होगा। ये प्रतिनिधित्व बदले में उसी तरह से अगले LM उत्पादन को प्रभावित कर सकते हैं जैसे एजेंटों के संचारात्मक इरादे उनकी भाषा को प्रभावित करते हैं। मैं हाल की साहित्य से निष्कर्षों का सर्वेक्षण करता हूं जो दिखाते हैं कि — भले ही आज के गैर-स्थिर और त्रुटिपूर्ण मॉडलों में — LMs सूक्ष्म संचारात्मक इरादों और उच्च-स्तरीय विश्वासों और लक्ष्यों के प्रतिनिधित्वों का अनुमान लगाते और उपयोग करते हैं। उनके प्रशिक्षण डेटा की सीमित प्रकृति के बावजूद, वे इस प्रकार उन प्रणालियों के लिए आधारशिला बन सकते हैं जो जानबूझकर संचार करती हैं और क्रिया करती हैं।
Building similarity graph...
Analyzing shared references across papers
Loading...
Jacob Andreas
Building similarity graph...
Analyzing shared references across papers
Loading...
Jacob Andreas (Sat,) ने इस प्रश्न का अध्ययन किया।
www.synapsesocial.com/papers/6a08a8141e0fcf4a43e8e426 — DOI: https://doi.org/10.18653/v1/2022.findings-emnlp.423
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: