January 1, 2022Open Access

एजेंट मॉडल के रूप में भाषा मॉडल

Key Points

Key points are not available for this paper at this time.

Abstract

भाषा मॉडल (LMs) उन दस्तावेज़ों के संग्रह पर प्रशिक्षित होते हैं, जिन्हें व्यक्तिगत मानव एजेंटों द्वारा बाहरी दुनिया में विशिष्ट उद्देश्यों को प्राप्त करने के लिए लिखा गया है। प्रशिक्षण के दौरान, LMs के पास केवल इन दस्तावेज़ों के पाठ तक पहुंच होती है, उन एजेंटों की आंतरिक अवस्थाओं के सीधे प्रमाण तक नहीं, जिन्होंने इन्हें बनाया — यह तथ्य अक्सर यह तर्क देने के लिए उपयोग किया जाता है कि LMs मानव भाषा उत्पादन और समझ के लक्ष्य-निर्दिष्ट पहलुओं को मॉडल करने में असमर्थ हैं। क्या पाठ पर प्रशिक्षित LMs भाषा और उपयोग के बीच संबंध के बारे में कुछ भी सीख सकते हैं? मैं तर्क देता हूं कि LMs संचारात्मक इरादों के मॉडल हैं, एक विशिष्ट, संकीर्ण अर्थ में। जब एक पाठ संदर्भ दिए जाने पर अगला शब्द अनुमानित किया जाता है, तो एक LM उस एजेंट की विशेषताओं को अनुमानित और प्रदर्शित कर सकता है, जिसने संभवतः वह संदर्भ उत्पन्न किया होगा। ये प्रतिनिधित्व बदले में उसी तरह से अगले LM उत्पादन को प्रभावित कर सकते हैं जैसे एजेंटों के संचारात्मक इरादे उनकी भाषा को प्रभावित करते हैं। मैं हाल की साहित्य से निष्कर्षों का सर्वेक्षण करता हूं जो दिखाते हैं कि — भले ही आज के गैर-स्थिर और त्रुटिपूर्ण मॉडलों में — LMs सूक्ष्म संचारात्मक इरादों और उच्च-स्तरीय विश्वासों और लक्ष्यों के प्रतिनिधित्वों का अनुमान लगाते और उपयोग करते हैं। उनके प्रशिक्षण डेटा की सीमित प्रकृति के बावजूद, वे इस प्रकार उन प्रणालियों के लिए आधारशिला बन सकते हैं जो जानबूझकर संचार करती हैं और क्रिया करती हैं।

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jacob Andreas

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

एजेंट मॉडल के रूप में भाषा मॉडल

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider