Los riesgos de la IA de vanguardia pueden requerir cooperación internacional, lo que a su vez puede exigir verificación: comprobar que todas las partes cumplen las normas acordadas. Por ejemplo, los estados podrían necesitar verificar que los modelos potentes de IA se despliegan ampliamente solo después de evaluar sus riesgos para la seguridad internacional y considerarlos manejables. No obstante, la investigación sobre la verificación de IA podría beneficiarse de mayor claridad y detalle. Para abordar esto, este informe ofrece una visión detallada sobre la verificación de IA, dirigida tanto a profesionales de políticas como a investigadores técnicos. Presentamos nuevos marcos conceptuales, opciones de implementación detalladas y los principales desafíos de I+D. Se identifican seis enfoques independientes para la verificación: (1-2) verificaciones técnicas basadas en el diseño del modelo y hardware; (3) dispositivos de monitoreo independientes acoplados a chips de IA; y (4-6) mecanismos basados en personal, como programas de denunciantes. Aunque prometedores, estos enfoques requieren salvaguardas para proteger contra abusos y concentración de poder, y muchas de estas tecnologías aún no han sido construidas o sometidas a pruebas exhaustivas. Para que los estados puedan verificar con confianza el cumplimiento de las normas sobre desarrollo y despliegue de IA a gran escala, se necesita un progreso significativo en los desafíos de I+D que enumeramos.
Building similarity graph...
Analyzing shared references across papers
Loading...
Matthew E. Baker
Gabriel Kulp
Oliver Marks
Building similarity graph...
Analyzing shared references across papers
Loading...
Baker et al. (Mon,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68d46fdc31b076d99fa6a74c — DOI: https://doi.org/10.48550/arxiv.2507.15916
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: