January 16, 2013Open Access

Effiziente Schätzung von Wortrepräsentationen im Vektorraum

Key Points

Key points are not available for this paper at this time.

Abstract

Wir schlagen zwei neuartige Modellarchitekturen vor, um kontinuierliche Vektorrepräsentationen von Wörtern aus sehr großen Datensätzen zu berechnen. Die Qualität dieser Repräsentationen wird in einer Wortähnlichkeitsaufgabe gemessen, und die Ergebnisse werden mit den bisher besten Techniken verglichen, die auf verschiedenen Arten von neuronalen Netzen basieren. Wir beobachten große Verbesserungen der Genauigkeit bei deutlich geringerem Rechenaufwand, das heißt, es dauert weniger als einen Tag, hochwertige Wortvektoren aus einem Datensatz mit 1,6 Milliarden Wörtern zu lernen. Darüber hinaus zeigen wir, dass diese Vektoren auf unserem Testdatensatz Spitzenleistungen bei der Messung syntaktischer und semantischer Wortähnlichkeiten erbringen.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Tomáš Mikolov

Kai Chen

Greg S. Corrado

Actions

Institutions

Google (United States)

Beijing University of Posts and Telecommunications

Brno University of Technology

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Effiziente Schätzung von Wortrepräsentationen im Vektorraum

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study