Este artículo presenta la tesis de diseño detrás de Aethon, una arquitectura de modelo fundamental no transformer desarrollada por OkeyMeta Ltd como una alternativa nativa en memoria a los modelos de lenguaje dominados por atención. La afirmación central es que la inteligencia de contexto largo debe emerger de la evolución estructurada del estado, la memoria selectiva y la composición recurrente, en lugar de la fusión de contexto cuadrática repetida. Describimos la motivación, la arquitectura de alto nivel, la disciplina de entrenamiento, la lógica de escalado y la justificación de eficiencia detrás de Aethon, mientras se retienen deliberadamente detalles de implementación que constituyen una ventaja propietaria. Aethon está organizado en torno a una familia propietaria de arquitecturas internamente referida como L-SBM (no es un transformer, no es un derivado de Mamba), y está diseñado en torno a cinco objetivos: manejo nativo de contexto largo, memoria comprimida persistente, fuerte capacidad de razonamiento, comportamiento de respuesta fundamentado y eficiencia de parámetros. Además, posicionamos a Aethon en relación con los modelos transformer y arquitecturas recientes de espacio de estado como Mamba, argumentando que la próxima frontera competitiva no reside en refinamientos marginales de transformers sino en diseños de modelo con prioridad en memoria. Este es un borrador de investigación estratégica. Los detalles de implementación se retienen intencionalmente. Todos los derechos reservados — © 2026 OkeyMeta Ltd.
Building similarity graph...
Analyzing shared references across papers
Loading...
Okechukwu Nwaozor
OkeyMeta Ltd
Aethon Labs
Okmetic (Finland)
Building similarity graph...
Analyzing shared references across papers
Loading...
Nwaozor et al. (Sat,) estudiaron esta cuestión.
www.synapsesocial.com/papers/69e5c42603c2939914029c07 — DOI: https://doi.org/10.5281/zenodo.19644720
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: