Este estudio investiga el enfoque de integrar el razonamiento en las salidas de grandes modelos de lenguaje (LLMs), combinando técnicas de inferencia lógica con recuperación de conocimiento, para mejorar su alineación con la verdad. Comenzamos analizando las bases estadísticas de los LLMs, que operan como generadores probabilísticos de texto basados en supuestos Markovianos sin una comprensión semántica genuina. A continuación, discutimos el marco conceptual de la “verdad” en el contexto de IA, diferenciando entre la verdad descriptiva (corrección objetiva), la verdad pragmática (utilidad contextual) y el conocimiento verificable (información respaldada por evidencia independiente). Examinamos técnicas avanzadas de razonamiento —desde Chain-of-Thought 1, Tree-of-Thought 2, Retrieval-Augmented Generation 3, hasta modelos de autocrítica como CriticGPT 4— que acercan a los LLMs al conocimiento verificado y mitigan las tendencias a la alucinación. El artículo también explora las implicaciones filosóficas: ¿Pueden los LLMs modernos, equipados con capacidades de razonamiento, considerarse “agentes cognitivos falibles” —análogos a los humanos en su capacidad para la corrección de errores y el aprendizaje— o son meramente loros estocásticos que imitan el lenguaje sin verdadera comprensión? Finalmente, abrimos una discusión sobre los riesgos, limitaciones y cuestiones éticas involucradas en el despliegue de sistemas de IA con razonamiento integrado, conectándolos con corrientes filosóficas contemporáneas como el pragmatismo, el antirrealismo y las perspectivas conductistas en la evaluación de la inteligencia artificial.
Building similarity graph...
Analyzing shared references across papers
Loading...
Nguyen Duc Xuan
Pham Van Khanh
Do Thi Loan
Edelweiss Applied Science and Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
Xuan et al. (Sat,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68c1b35954b1d3bfb60ea246 — DOI: https://doi.org/10.55214/25768484.v9i7.8810
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: