January 2, 2024Open Access

बड़े भाषा मॉडल्स के लिए व्याख्यात्मकता: एक सर्वेक्षण

Key Points

Key points are not available for this paper at this time.

Abstract

बड़े भाषा मॉडल्स (LLMs) ने प्राकृतिक भाषा प्रसंस्करण में प्रभावशाली क्षमताएं प्रदर्शित की हैं। हालांकि, उनके आंतरिक तंत्र अभी भी अस्पष्ट हैं और इस पारदर्शिता की कमी से डाउनस्ट्रीम अनुप्रयोगों में अवांछित जोखिम उत्पन्न होते हैं। इसलिए, इन मॉडलों को समझना और समझाना उनके व्यवहार, सीमाओं और सामाजिक प्रभावों को स्पष्ट करने के लिए महत्वपूर्ण है। इस लेख में, हम व्याख्यात्मकता तकनीकों की एक वर्गीकरण प्रणाली प्रस्तुत करते हैं और ट्रांसफॉर्मर-आधारित भाषा मॉडलों को समझाने के तरीकों का एक संरचित अवलोकन प्रदान करते हैं। हम LLMs के प्रशिक्षण पैरेडाइम के आधार पर तकनीकों को वर्गीकृत करते हैं: पारंपरिक फाइन-ट्यूनिंग-आधारित पैरेडाइम और प्रॉम्प्टिंग-आधारित पैरेडाइम। प्रत्येक पैरेडाइम के लिए, हम व्यक्तिगत भविष्यवाणियों की स्थानीय व्याख्याएँ उत्पन्न करने और समग्र मॉडल ज्ञान की वैश्विक व्याख्याओं के लिए लक्ष्यों और प्रमुख दृष्टिकोणों का सारांश प्रस्तुत करते हैं। हम उत्पन्न व्याख्याओं का मूल्यांकन करने के लिए मीट्रिक्स पर भी चर्चा करते हैं और बताते हैं कि मॉडल्स को डिबग करने और प्रदर्शन सुधारने के लिए व्याख्याओं का उपयोग कैसे किया जा सकता है। अंत में, हम LLMs के युग में व्याख्या तकनीकों के लिए प्रमुख चुनौतियों और उभरते अवसरों की तुलना पारंपरिक डीप लर्निंग मॉडलों के साथ करते हैं।

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Haiyan Zhao

Hanjie Chen

Fan Yang

Journals

ACM Transactions on Intelligent Systems and Technology

Actions

Institutions

Johns Hopkins University

University of Georgia

Wake Forest University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

बड़े भाषा मॉडल्स के लिए व्याख्यात्मकता: एक सर्वेक्षण

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider