Los puntos clave no están disponibles para este artículo en este momento.
Los grandes modelos de lenguaje (LLMs) han tomado un papel central en los debates sobre la Inteligencia Artificial. Sin embargo, aún existe una brecha en cómo evaluar la conformidad de los LLMs con valores humanos importantes. En este artículo, investigamos si los LLMs más avanzados, GPT-4 y Claude 2.1 (Gemini Pro y LLAMA 2 no generaron resultados válidos), son hipócritas morales. Empleamos dos instrumentos de investigación basados en la Teoría de Fundaciones Morales: (i) el Cuestionario de Fundaciones Morales (MFQ), que investiga qué valores se consideran moralmente relevantes en juicios morales abstractos; y (ii) las Viñetas de Fundaciones Morales (MFVs), que evalúan la cognición moral en escenarios concretos relacionados con cada fundación moral. Caracterizamos los conflictos en valores entre estas diferentes abstracciones de evaluación moral como hipocresía. Encontramos que ambos modelos mostraron una consistencia razonable dentro de cada instrumento comparados con humanos, pero mostraron comportamientos contradictorios e hipócritas cuando comparamos los valores abstractos presentes en el MFQ con la evaluación de violaciones morales concretas del MFV.
Building similarity graph...
Analyzing shared references across papers
Loading...
José Luiz Nunes
Guilherme Almeida
Marcelo de Araújo
Building similarity graph...
Analyzing shared references across papers
Loading...
Nunes et al. (Fri,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e69aefb6db643587620735 — DOI: https://doi.org/10.48550/arxiv.2405.11100
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: