La IA no arregla el caos: el sistema importa más que el modelo

¡Hola DevExpert!

Esta semana se ha repetido la misma idea desde varios ángulos: el problema ya no suele ser “qué modelo has elegido”, sino qué sistema has construido alrededor del agente. Contexto, validación, ownership, herramientas y guardrails. Si eso falla, la IA no arregla nada. Solo acelera el caos.

TL;DR de esta semana:

Vídeo: Orquestación de Agentes: Control Determinista con Hooks - Cómo meter control real cuando un agente deja de ser una demo y empieza a tocar flujos delicados.
Tema de la semana: No es el modelo, es el sistema - adopción en empresa, calidad de software y guardrails alrededor del agente.
Novedades de modelos y tooling: Gemini Embedding 2 · Skills para mantenimiento open source

El tema de la semana: no es el modelo, es el sistema

Lo he dicho varias veces estos días porque creo que es la conversación importante ahora mismo: muchas empresas no tienen un problema de modelo. Tienen un problema de sistema.

Lo resumí bastante claro en este post: compras licencias, no formas al equipo, no cambias procesos, no defines ownership ni validación, y luego te sorprende que “esto no haya funcionado”.

La misma idea aparece en esta reflexión sobre calidad de software: la IA no mejora nada por sí sola. Lo que mejora la calidad es el sistema que montas alrededor del agente para que falle poco, falle visible y falle barato.

Por eso el vídeo de esta semana me parece especialmente relevante. En esta sesión sobre hooks, Nino enseña cómo meter guardrails para que la orquestación sea controlable, auditable y segura. Justo lo que necesitas cuando un agente puede tocar infraestructura o código sensible.

Y esto también se ve en producto. PostFlow sigue evolucionando con una idea muy concreta: que el mismo sistema pueda operarse desde API, CLI o MCP sin fricción. La interfaz cambia; el sistema sigue siendo uno.

En paralelo, publiqué también este artículo sobre los ADEs, porque creo que la siguiente capa de cambio está ahí: pasamos de discutir si el IDE sigue vivo a rediseñar directamente el entorno de trabajo alrededor de agentes.

El vídeo de la semana: hooks y control determinista

Si tienes agentes ejecutando tareas reales, este vídeo merece prioridad. Explica muy bien cómo convertir un flujo probabilístico en algo mucho más gobernable.

Ver el vídeo en YouTube

Lo que ha pasado esta semana

Llegan los ADEs

Publiqué un artículo sobre cómo estamos pasando de IDEs y CLIs agénticos a entornos diseñados directamente para coordinar agentes.

Leer artículo

Nueva edición de AI Expert

Arrancó una nueva edición y la idea base sigue siendo la misma: esto no va de aprender prompts, sino de trabajar con IA en un entorno real con criterio, validación y herramientas.

Ver post

Lecturas recomendadas

Cómo usa OpenAI las skills para mantener open source

Muy buena referencia práctica: planificación, implementación, testing y release-readiness dentro de un mismo flujo.

Ver publicación

SWE-CI: evaluar mantenimiento real, no solo aciertos puntuales

Un benchmark mucho más interesante que el típico “¿pasa tests una vez?”: mide si el sistema sigue aguantando cambios a lo largo del tiempo.

Ver paper

Codex 0.114.0 añade hooks

Todavía son básicos, pero apuntan justo en la dirección correcta: una capa programable alrededor del ciclo de vida del agente.

Ver post

Novedades de modelos y tooling

Gemini Embedding 2 - Google lo presenta como nuevo SOTA multimodal para llevar texto, imagen, vídeo, audio y documentos al mismo espacio de embeddings.

Skills para mantenimiento open source - No es un modelo nuevo, pero sí una señal interesante: el valor se mueve hacia workflows reproducibles y no solo hacia mejores prompts.

Próxima edición de AI Expert

Si quieres dominar este tipo de flujos de trabajo, en AI Expert trabajamos justo eso: agentes, context engineering, automatización y sistemas fiables cuando la IA empieza a tocar piezas reales.

Toda la información aquí

Un abrazo,

Antonio.