Key points are not available for this paper at this time.
Neuronale Netzwerke dominieren die moderne Landschaft des maschinellen Lernens, aber ihr Training und Erfolg leiden immer noch unter der Sensitivität gegenüber empirischen Entscheidungen von Hyperparametern wie Modellarchitektur, Verlustfunktion und Optimierungsalgorithmus. In dieser Arbeit stellen wir Population Based Training (PBT) vor, einen einfachen asynchronen Optimierungsalgorithmus, der ein festes Rechenbudget effektiv nutzt, um gemeinsam eine Population von Modellen und deren Hyperparameter zu optimieren, um die Leistung zu maximieren. Wichtig ist, dass PBT einen Zeitplan von Hyperparametereinstellungen entdeckt, anstatt der im Allgemeinen suboptimalen Strategie zu folgen, zu versuchen, einen einzigen festen Satz für den gesamten Trainingsverlauf zu finden. Mit nur einer kleinen Modifikation eines typischen verteilten Hyperparameter-Trainingsrahmens ermöglicht unsere Methode robustes und zuverlässiges Training von Modellen. Wir demonstrieren die Effektivität von PBT bei tiefen Verstärkungslernproblemen, zeigen schnellere Wall-Clock-Konvergenz und eine höhere Endleistung von Agenten durch Optimierung über eine Reihe von Hyperparametern. Zusätzlich zeigen wir, dass dieselbe Methode auf überwachtes Lernen für maschinelle Übersetzung angewendet werden kann, wobei PBT verwendet wird, um die BLEU-Punktzahl direkt zu maximieren, sowie beim Training von Generative Adversarial Networks, um den Inception-Score der generierten Bilder zu maximieren. In allen Fällen führt PBT zur automatischen Entdeckung von Hyperparameterschedules und Modellauswahl, die zu stabilem Training und besserer Endleistung führt.
Building similarity graph...
Analyzing shared references across papers
Loading...
Max Jaderberg
Valentin Dalibard
Simon Osindero
Building similarity graph...
Analyzing shared references across papers
Loading...
Jaderberg et al. (Mon,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/69deaad340ea065679558fef — DOI: https://doi.org/10.48550/arxiv.1711.09846