ट्रांसफॉर्मर पूर्वानुमान हर इनपुट को इसके कठिनाई स्तर की परवाह किए बिना सभी N स्तरों के माध्यम से चलाता है। प्रारंभिक निकास विधियाँ इस लागत को कम करती हैं जो मध्यवर्ती स्तरों पर वर्गीकारक सम्मिलित करके और जब आत्मविश्वास पर्याप्त होता है तो आउटपुट देती हैं। वर्तमान विधियाँ — एन्ट्रॉपी थ्रेशोल्डिंग और पेशेंस मैकेनिज्म (Zhou et al., 2020) — स्थिर संकेतों का उपयोग करती हैं: या तो वर्तमान आत्मविश्वास स्तर या क्या हाल ही में भविष्यवाणी बदली है। इन दोनों में से कोई भी यह ट्रैक नहीं करता कि आत्मविश्वास अनुकूल अपेक्षित ट्राजेक्टरी के सापेक्ष सुधर रहा है या नहीं। हम स्टोकास्टिक पावर मीट्रिक P(t) = E(t) × W(t) को निकास मानदंड के रूप में उपयोग करने का प्रस्ताव करते हैं, जहाँ E(t) वास्तविक आत्मविश्वास को अनुकूल अपेक्षित आत्मविश्वास के सापेक्ष मापता है और W(t) इस बात का EWMA है कि हाल के स्तरों में E(t) ने 1.0 को पार किया है या नहीं। यह संरचनात्मक रूप से Leaky Integrate-and-Fire न्यूरॉन मॉडल (Cantrell 2026) के समान है: मॉडल तब फायर करता है — निकास करता है — जब संचित आत्मविश्वास साक्ष्य थ्रेशोल्ड पार कर जाता है। एक सिमुलेशन अध्ययन में जो BERT-बेस आर्किटेक्चर (12 स्तर, चार कठिनाई स्तरों में 600 इनपुट) के लिए कैलिब्रेटेड है, पावर मीट्रिक 99.7% सटीकता बनाए रखते हुए 55.9% कंप्यूट बचत प्राप्त करता है, जबकि 14.6% बचत (आत्मविश्वास थ्रेशोल्ड) और 52.6% बचत (पेशेंस) दोनों 100% सटीकता पर हैं। महत्वपूर्ण रूप से, पावर मीट्रिक ही एकमात्र विधि है जो सही तरीके से स्तर आवंटन को इनपुट कठिनाई के साथ स्केल करता है: आसान इनपुट औसतन 3.6 स्तरों पर निकास करते हैं, मध्यम 5.2 पर, और कठिन 6.3 पर। ये निष्कर्ष प्रारंभिक हैं; प्रशिक्षित निकास वर्गीकारकों के साथ वास्तविक BERT/GPT मॉडल पर वैधता आवश्यक अगला कदम है। कीवर्ड्स: प्रारंभिक निकास, अनुकूलन गणना, ट्रांसफॉर्मर पूर्वानुमान, पेशेंस मैकेनिज्म, एन्ट्रॉपी थ्रेशोल्ड, पावर मीट्रिक, एलआईएफ न्यूरॉन, कठिनाई-प्रतिसाद आवंटन, BERT
Building similarity graph...
Analyzing shared references across papers
Loading...
Cole Cantrell
Building similarity graph...
Analyzing shared references across papers
Loading...
कोल कैंटरेल (सोम.) ने इस प्रश्न का अध्ययन किया।
www.synapsesocial.com/papers/69f1545d879cb923c4944798 — DOI: https://doi.org/10.5281/zenodo.19803061
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: