Key points are not available for this paper at this time.
बड़े भाषा मॉडल्स (LLMs) ने प्राकृतिक भाषा प्रसंस्करण में प्रभावशाली क्षमताएं प्रदर्शित की हैं। हालांकि, उनके आंतरिक तंत्र अभी भी अस्पष्ट हैं और इस पारदर्शिता की कमी से डाउनस्ट्रीम अनुप्रयोगों में अवांछित जोखिम उत्पन्न होते हैं। इसलिए, इन मॉडलों को समझना और समझाना उनके व्यवहार, सीमाओं और सामाजिक प्रभावों को स्पष्ट करने के लिए महत्वपूर्ण है। इस लेख में, हम व्याख्यात्मकता तकनीकों की एक वर्गीकरण प्रणाली प्रस्तुत करते हैं और ट्रांसफॉर्मर-आधारित भाषा मॉडलों को समझाने के तरीकों का एक संरचित अवलोकन प्रदान करते हैं। हम LLMs के प्रशिक्षण पैरेडाइम के आधार पर तकनीकों को वर्गीकृत करते हैं: पारंपरिक फाइन-ट्यूनिंग-आधारित पैरेडाइम और प्रॉम्प्टिंग-आधारित पैरेडाइम। प्रत्येक पैरेडाइम के लिए, हम व्यक्तिगत भविष्यवाणियों की स्थानीय व्याख्याएँ उत्पन्न करने और समग्र मॉडल ज्ञान की वैश्विक व्याख्याओं के लिए लक्ष्यों और प्रमुख दृष्टिकोणों का सारांश प्रस्तुत करते हैं। हम उत्पन्न व्याख्याओं का मूल्यांकन करने के लिए मीट्रिक्स पर भी चर्चा करते हैं और बताते हैं कि मॉडल्स को डिबग करने और प्रदर्शन सुधारने के लिए व्याख्याओं का उपयोग कैसे किया जा सकता है। अंत में, हम LLMs के युग में व्याख्या तकनीकों के लिए प्रमुख चुनौतियों और उभरते अवसरों की तुलना पारंपरिक डीप लर्निंग मॉडलों के साथ करते हैं।
Building similarity graph...
Analyzing shared references across papers
Loading...
Haiyan Zhao
Hanjie Chen
Fan Yang
ACM Transactions on Intelligent Systems and Technology
Johns Hopkins University
University of Georgia
Wake Forest University
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhao et al. (Tue,) ने इस प्रश्न का अध्ययन किया।
www.synapsesocial.com/papers/693719b1cff1c8fb450626f8 — DOI: https://doi.org/10.1145/3639372
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: