Replicar la capacidad de Mythos es imposible - no se libera. Replicar su disciplina arquitectonica si, y es donde se gana o se pierde. El error estrategico es perseguir el modelo mas grande; el acierto es construir el andamiaje que cualquier modelo frontera potente necesita para ser seguro y util.
Este es un documento de trabajo. Mapea tu sistema contra las seis capas. Tiempo para mapear: 45-60 minutos. Resultado: un blueprint del harness que separa un juguete probabilistico de un sistema en el que puedes confiar en produccion.
01 · Capa 1 - Verificacion (oraculos, no confianza)
El principio mas transferible de todo el reporte de Mythos: no confies en la salida del modelo, verificala con un oraculo determinista. Mythos uso sanitizers (ASan) como oraculo perfecto - cero falsos positivos.
02 · Capa 2 - Sandbox (aislamiento real)
Ejecutar codigo o acciones no confiables sin aislamiento real es jugar con fuego. Docker comparte kernel: insuficiente para lo no confiable.
03 · Capa 3 - Contexto y memoria (el recurso escaso)
La ventana de contexto es tu recurso mas caro. Gestionarla mal degrada todo el sistema.
04 · Capa 4 - Gobernanza (quien puede hacer que)
Un agente sin limites de capacidad es un incidente esperando ocurrir. La gobernanza convierte instrucciones probabilisticas en garantias duras.
05 · Capa 5 - Interpretabilidad (trazabilidad en runtime)
No basta con que funcione; necesitas saber por que actuo, sobre todo cuando actua raro.
06 · Capa 6 - Divulgacion y ciclo de vida (CVD)
Si tu sistema encuentra fallos, necesitas un proceso responsable para manejarlos - o generas mas riesgo del que resuelves.
Conecta las seis
Tener las seis capas no es el objetivo. Conectarlas si.
Scorecard del Harness
Puntua tu sistema - 6 preguntas si/no:
- Cada salida critica pasa por un oraculo determinista antes de aceptarse?
- El codigo no confiable corre en micro-VM (no solo Docker) con red aislada?
- Separas memoria always-on de on-demand con progressive disclosure?
- Los subagentes tienen capabilities minimas y las acciones de alto riesgo doble control?
- Puedes trazar por que actuo el agente y abortar si aparecen features de ocultacion?
- Ninguna vulnerabilidad sale sin pasar un gate de divulgacion coordinada?
Tu puntaje:
- 0-2 - Andamiaje fragil. Empieza por verificacion (Capa 1) y sandbox (Capa 2).
- 3-4 - Base solida, faltan garantias duras. Prioriza gobernanza e interpretabilidad.
- 5-6 - Harness de maximo nivel. Ahora sube a verificacion formal y co-evolucion adversarial.
Roadmap por fases
Fase 1 (0-3 meses): agent loop + esquemas tipados, ACI con str_replace_editor y repo map; sandbox Firecracker/gVisor con red aislada; memoria por capas.
Fase 2 (3-9 meses): orquestacion multi-agente con agentes de critica y doble control; ASan como oraculo; CVD-gate con SHA-3; evals descontaminados.
Fase 3 (9-18 meses): verificacion formal (Dafny/Lean + property-based testing); co-evolucion adversarial; deterministic replay + concealment monitors; ejecucion consciente de la politica.
Ver el scorecard interactivo · Leer el articulo completo
Construyendo con IA y quieres que sea seguro de verdad? Escribe FABLE por WhatsApp · ES · EN - o agenda una llamada tecnica gratis.



