Key points are not available for this paper at this time.
Nach einer mehr als zehnjährigen Periode mit relativ wenig Forschungsaktivität im Bereich der rekurrenten neuronalen Netzwerke werden hier mehrere neue Entwicklungen vorgestellt, die sowohl im Verständnis als auch in technischen Lösungen für eine effizientere Trainingsmethode rekurrenter Netzwerke erheblichen Fortschritt ermöglicht haben. Diese Fortschritte wurden durch und in Zusammenhang mit den Optimierungsproblemen im Bereich des Deep Learning motiviert. Obwohl rekurrente Netzwerke in der Lage sind, prinzipiell sehr komplexe Abfolgen zu modellieren, ist ihr Training durch zwei Aspekte desselben Problems bezüglich des Lernens langfristiger Abhängigkeiten erschwert. Hier berichtete Experimente evaluieren den Einsatz von Gradient Clipping, das Abdecken längerer Zeiträume mittels Leaky Integration, fortschrittliche Momentum-Techniken, den Einsatz leistungsfähigerer Modelle für Ausgabewahrscheinlichkeiten sowie das Fördern spärlicherer Gradienten, um Symmetriebruch und Zuordnung von Lernbeiträgen zu unterstützen. Die Experimente wurden an Text- und Musikdaten durchgeführt und zeigen die kombinierten Effekte dieser Techniken, die sowohl Trainings- als auch Testfehler allgemein verbessern.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yoshua Bengio
Nicolas Boulanger-Lewandowski
Razvan Pascanu
Université de Montréal
Building similarity graph...
Analyzing shared references across papers
Loading...
Bengio et al. (Wed,) haben diese Frage untersucht.
www.synapsesocial.com/papers/6a06c97e2edded7c7b84149a — DOI: https://doi.org/10.1109/icassp.2013.6639349
Synapse has enriched 2 closely related papers on similar clinical questions. Consider them for comparative context: