Los puntos clave no están disponibles para este artículo en este momento.
Resumen Diseñamos una batería de ilusiones semánticas y pruebas de reflexión cognitiva, destinadas a elicitar respuestas intuitivas pero erróneas. Aplicamos estas tareas, tradicionalmente usadas para estudiar el razonamiento y la toma de decisiones en humanos, a la familia de modelos generativos preentrenados de OpenAI. Los resultados muestran que, a medida que los modelos crecen en tamaño y competencia lingüística, muestran cada vez más un pensamiento intuitivo tipo sistema 1 parecido al humano y errores cognitivos asociados. Este patrón cambia notablemente con la introducción de los modelos ChatGPT, que tienden a responder correctamente, evitando las trampas incrustadas en las tareas. Tanto ChatGPT-3.5 como 4 utilizan la ventana de contexto de entrada-salida para involucrarse en un razonamiento en cadena de pensamiento, reminiscente de cómo las personas usan cuadernos para apoyar su pensamiento de sistema 2. Sin embargo, permanecen precisos incluso cuando se les impide realizar este razonamiento en cadena, lo que indica que sus procesos de generación de la siguiente palabra, similares al sistema 1, son más exactos que los de modelos anteriores. Nuestros hallazgos destacan el valor de aplicar metodologías psicológicas para estudiar grandes modelos de lenguaje, ya que esto puede descubrir características emergentes previamente no detectadas.
Building similarity graph...
Analyzing shared references across papers
Loading...
Thilo Hagendorff
Sarah Fabi
Michał Kosiński
Nature Computational Science
Stanford University
University of California, San Diego
Stanford Medicine
Building similarity graph...
Analyzing shared references across papers
Loading...
Hagendorff et al. (jueves,) estudiaron esta cuestión.
www.synapsesocial.com/papers/69d685edd93a727eca1f2d24 — DOI: https://doi.org/10.1038/s43588-023-00527-x