What question did this study set out to answer?

El objetivo es desarrollar una arquitectura de modelo nativo en memoria que aumente la inteligencia en contexto largo mediante interacciones estructuradas de memoria.

April 20, 2026Open Access

Aethon: Hacia un modelo fundamental post-transformer nativo en memoria

Puntos clave

El objetivo es desarrollar una arquitectura de modelo nativo en memoria que aumente la inteligencia en contexto largo mediante interacciones estructuradas de memoria.
Diseñada una arquitectura novedosa llamada L-SBM, distinta de transformers y derivados de Mamba.
Enfocado en disciplinas de entrenamiento y lógica de escalado para mejorar la eficiencia y la capacidad de razonamiento.
Identificados cinco objetivos que guían la arquitectura: manejo de contexto largo, memoria comprimida, razonamiento, respuestas fundamentadas y eficiencia de parámetros.
Aethon se posiciona como una alternativa competitiva a los modelos transformer existentes.
La arquitectura muestra potencial para una inteligencia efectiva en contexto largo sin dependencia de la fusión cuadrática de contexto.
Se presenta el argumento de que el futuro del desarrollo de modelos reside en diseños centrados en la memoria.

Resumen

Este artículo presenta la tesis de diseño detrás de Aethon, una arquitectura de modelo fundamental no transformer desarrollada por OkeyMeta Ltd como una alternativa nativa en memoria a los modelos de lenguaje dominados por atención. La afirmación central es que la inteligencia de contexto largo debe emerger de la evolución estructurada del estado, la memoria selectiva y la composición recurrente, en lugar de la fusión de contexto cuadrática repetida. Describimos la motivación, la arquitectura de alto nivel, la disciplina de entrenamiento, la lógica de escalado y la justificación de eficiencia detrás de Aethon, mientras se retienen deliberadamente detalles de implementación que constituyen una ventaja propietaria. Aethon está organizado en torno a una familia propietaria de arquitecturas internamente referida como L-SBM (no es un transformer, no es un derivado de Mamba), y está diseñado en torno a cinco objetivos: manejo nativo de contexto largo, memoria comprimida persistente, fuerte capacidad de razonamiento, comportamiento de respuesta fundamentado y eficiencia de parámetros. Además, posicionamos a Aethon en relación con los modelos transformer y arquitecturas recientes de espacio de estado como Mamba, argumentando que la próxima frontera competitiva no reside en refinamientos marginales de transformers sino en diseños de modelo con prioridad en memoria. Este es un borrador de investigación estratégica. Los detalles de implementación se retienen intencionalmente. Todos los derechos reservados — © 2026 OkeyMeta Ltd.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Okechukwu Nwaozor

OkeyMeta Ltd

Aethon Labs

Actions

Institutions

Okmetic (Finland)

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Aethon: Hacia un modelo fundamental post-transformer nativo en memoria

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider