Key points are not available for this paper at this time.
हम ग्रेडिएंट डिसेंट के लिए एक नए प्रति-आयाम लर्निंग रेट विधि ADADELTA प्रस्तुत करते हैं। यह विधि केवल प्रथम क्रम की जानकारी का उपयोग करके समय के साथ गतिशील रूप से अनुकूलित होती है और मामूली संगणकीय ओवरहेड के साथ साधारण स्टोकास्टिक ग्रेडिएंट डिसेंट से अधिक नहीं है। इस विधि को लर्निंग रेट के मैन्युअल ट्यूनिंग की आवश्यकता नहीं होती और यह शोरयुक्त ग्रेडिएंट जानकारी, विभिन्न मॉडल आर्किटेक्चर विकल्पों, विभिन्न डेटा मोडलिटी और हाइपरपैरामीटर चयन के प्रति मजबूत प्रतीत होती है। हम MNIST अंक वर्गीकरण कार्य में एक एकल मशीन का उपयोग करते हुए और वितरित क्लस्टर पर्यावरण में बड़े पैमाने पर वॉइस डेटासेट पर अन्य विधियों की तुलना में वादात्मक परिणाम दिखाते हैं।
Building similarity graph...
Analyzing shared references across papers
Loading...
Matthew D. Zeiler
Building similarity graph...
Analyzing shared references across papers
Loading...
मैथ्यू डी. ज़ीलर (शनि,) ने इस प्रश्न का अध्ययन किया।
www.synapsesocial.com/papers/696402a893519ba8671d048f — DOI: https://doi.org/10.48550/arxiv.1212.5701
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: