वैश्वीकरण और बढ़ती क्रॉस-भाषा सूचना आवश्यकताओं के बीच, मशीन अनुवाद भाषा बाधाओं को दूर करने के लिए अत्यंत महत्वपूर्ण है। डीप लर्निंग ने इसे आगे बढ़ाया है, लेकिन ट्रांसफॉर्मर की सीमाएँ हैं: लंबी दूरी की निर्भरताओं को पकड़ने में अपर्याप्त दक्षता और कम संसाधन अनुवाद में खराब प्रदर्शन। इन समस्याओं को संबोधित करने के लिए, यह अध्ययन तीन मुख्य समाधान प्रस्तुत करता है: 1) एलएसटीएम की गेटिंग तंत्र (लंबी अनुक्रम मॉडलिंग) और ट्रांसफॉर्मर के सेल्फ-अटेंशन (वैश्विक संदर्भ पकड़ना) को मिलाकर एक हाइब्रिड एलएसटीएम-ट्रांसफॉर्मर वास्तुकला; 2) प्रशिक्षण स्थिरता के लिए अनुकूली ग्रेडिएंट क्लिपिंग (AGC) रणनीति; 3) क्रॉस-भाषा स्थानांतरण को बढ़ाने के लिए विरोधी डोमेन अनुकूलन के साथ गतिशील भार साझा करना। WMT14 अंग्रेज़ी-जर्मन/फ्रांसीसी कॉर्पस पर प्रयोगों से पता चलता है कि इस मॉडल का BLEU मान बेंचमार्क ट्रांसफॉर्मर से 2.8 अधिक है, जिसे 18% तेज अभिसरण प्राप्त हुआ; अंग्रेज़ी-रोमानियाई कम संसाधन परिदृश्यों में, स्थानांतरण तंत्र BLEU को 5.3 द्वारा बढ़ाता है। यह अध्ययन हाइब्रिड वास्तुकला और अनुकूलन रणनीतियों को मान्य करता है, जो कुशल ग्रेडिएंट अनुकूलन और कम संसाधन अनुवाद मॉडलों के लिए नए विचार प्रदान करता है।
Building similarity graph...
Analyzing shared references across papers
Loading...
Meizhen Zou
International Journal of Information and Communication Technology
ZheJiang Academy of Agricultural Sciences
Shaoxing University
Building similarity graph...
Analyzing shared references across papers
Loading...
Meizhen Zou (Thu,) ने इस प्रश्न का अध्ययन किया।
www.synapsesocial.com/papers/69c772058bbfbc51511e228e — DOI: https://doi.org/10.1504/ijict.2026.152530
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: