January 1, 2021Open Access

SimCSE: Aprendizaje Contrastivo Simple de Embeddings de Oraciones

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Este artículo presenta SimCSE, un marco simple de aprendizaje contrastivo que avanza considerablemente el estado del arte en embeddings de oraciones. Primero describimos un enfoque no supervisado, que toma una oración de entrada y la predice a sí misma en un objetivo contrastivo, utilizando solo dropout estándar como ruido. Este método sencillo funciona sorprendentemente bien, rindiendo a la par con los métodos supervisados anteriores. Encontramos que el dropout actúa como una mínima augmentación de datos y que eliminarlo conduce a un colapso de la representación. Luego, proponemos un enfoque supervisado, que incorpora pares anotados de conjuntos de datos de inferencia de lenguaje natural en nuestro marco de aprendizaje contrastivo, usando pares de "entailment" como positivos y pares de "contradiction" como negativos difíciles. Evaluamos SimCSE en tareas estándar de similitud semántica textual (STS), y nuestros modelos no supervisado y supervisado usando BERT base alcanzan un promedio de 76.3% y 81.6% de correlación de Spearman respectivamente, una mejora de 4.2% y 2.2% comparado con los mejores resultados previos. También demostramos, tanto teórica como empíricamente, que el objetivo de aprendizaje contrastivo regulariza el espacio anisotrópico de embeddings preentrenados para ser más uniforme, y alinea mejor los pares positivos cuando señales supervisadas están disponibles.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Tianyu Gao

Xingcheng Yao

Danqi Chen

Actions

Institutions

Princeton University

Tsinghua University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

SimCSE: Aprendizaje Contrastivo Simple de Embeddings de Oraciones

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider