Key points are not available for this paper at this time.
Wir schlagen zwei neuartige Modellarchitekturen vor, um kontinuierliche Vektorrepräsentationen von Wörtern aus sehr großen Datensätzen zu berechnen. Die Qualität dieser Repräsentationen wird in einer Wortähnlichkeitsaufgabe gemessen, und die Ergebnisse werden mit den bisher besten Techniken verglichen, die auf verschiedenen Arten von neuronalen Netzen basieren. Wir beobachten große Verbesserungen der Genauigkeit bei deutlich geringerem Rechenaufwand, das heißt, es dauert weniger als einen Tag, hochwertige Wortvektoren aus einem Datensatz mit 1,6 Milliarden Wörtern zu lernen. Darüber hinaus zeigen wir, dass diese Vektoren auf unserem Testdatensatz Spitzenleistungen bei der Messung syntaktischer und semantischer Wortähnlichkeiten erbringen.
Building similarity graph...
Analyzing shared references across papers
Loading...
Tomáš Mikolov
Kai Chen
Greg S. Corrado
Google (United States)
Beijing University of Posts and Telecommunications
Brno University of Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
Mikolov et al. (Wed,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/69de9d78499d77a496b0c1a0 — DOI: https://doi.org/10.48550/arxiv.1301.3781