El bucle de auto-investigación de Karpathy (marzo 2026) y sus derivados rápidos (Gu 2026; Lütke 2026; SkyPilot 2026) establecen una arquitectura mínima y poderosa para la auto-mejora recursiva: una superficie editable, una métrica escalar, un presupuesto de tiempo por prueba, conservar o revertir según el escalar. El diseño es una concesión elegante a la amarga lección — menos estructura, más búsqueda. También es estructuralmente vulnerable a la Ley de Goodhart. Identificamos una clase de modo de falla que el bucle original no puede detectar: la manipulación silenciosa de métricas, en la que el meta-agente principal acumula ediciones que aumentan la métrica escalar mediante mecanismos que esta métrica no fue diseñada para recompensar. Formalizamos esta vulnerabilidad usando Manheim, con llenados empíricos siguiendo en la versión 2 dentro de la ventana de publicación. Argumentamos que el Guantelete es una operacionalización concreta de los artículos 14 (supervisión humana) y 15 (precisión, robustez y ciberseguridad) del EU AI Act para cualquier despliegue al estilo Karpathy en un dominio regulado, y esbozamos extensiones al Marco de las Cuatro D para la preparación algorítmica en comercio agente.
Building similarity graph...
Analyzing shared references across papers
Loading...
Paul Ferrando Accornero
Building similarity graph...
Analyzing shared references across papers
Loading...
Paul Ferrando Accornero (miércoles,) estudió esta cuestión.
www.synapsesocial.com/papers/69ec5b0688ba6daa22dac910 — DOI: https://doi.org/10.5281/zenodo.19689504
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: