DevExpert

¡Hola DevExpert!

Esta semana ha sido una de esas en las que todo apunta en la misma dirección: el desarrollo de software agéntico ya no es una promesa, es la nueva realidad. He publicado, probado y reflexionado sobre cómo orquestar agentes en paralelo, y el resultado ha sido bastante revelador.

TL;DR de esta semana:


El tema de la semana: La era del desarrollo agéntico

Esta semana me he dado cuenta de que ya no estoy "probando" el desarrollo agéntico. Lo estoy viviendo.

El lunes publiqué un framework con las 7 fases del desarrollo agéntico: desde convertir una idea en issues hasta cerrar con una PR trazable. No es teoría — es exactamente el flujo que uso a diario con Claude Code y Codex.

Y la clave de todo esto es el pensamiento paralelo. Como comentaba en este post, crear specs mientras desarrollas dos features y solucionas un bug ya no es ciencia ficción. Es martes por la mañana.

De hecho, esta semana me puse un reto: crear una academia entera partiendo de un solo prompt. Me pasé una hora en plan mode con Codex definiendo la visión, después Pencil me generó los diseños, y mediante MCP todo se conectó. Un día después tenía el dashboard funcional. No fue "un prompt mágico", pero hace meses esto era directamente impensable.

Lo que me sorprende es cómo las automatizaciones complementan este flujo. Cada martes, un cron de Codex App descarga mis sesiones de Zoom, las transcribe, genera capítulos e identifica las slides correspondientes. El trabajo manual que antes me costaba una hora de esfuerzo cognitivo ahora me lo encuentro listo al sentarme.

Y la industria va en la misma dirección. OpenAI acaba de lanzar nuevos primitivos en la Responses API: server-side compaction para que los agentes corran horas sin quedarse sin contexto, containers con networking, y soporte nativo para el estándar Agent Skills. Los agentes de larga duración acaban de dar un salto muy serio.


El vídeo de la semana: Verdent

Verdent propone algo que no había visto antes: antes de escribir una sola línea, lanza tu plan a tres LLMs distintos (Claude, GPT y Gemini). Solo cuando hay consenso, el agente empieza a implementar.

Además permite ejecutar tareas en paralelo, trabajar en local, y hacer code review cruzado con diferentes modelos. Es un vistazo muy real a cómo los IDEs están dejando de ser editores de texto para convertirse en centros de orquestación.

Ver el vídeo en YouTube


Lecturas recomendadas

Claude Code desde el navegador (y el móvil)

Stan Girard hizo ingeniería inversa del binario de Claude Code y encontró un flag oculto: --sdk-url. Con él, el CLI se convierte en un cliente WebSocket. Montó un servidor, le puso una UI en React, y ahora usa Claude Code desde el navegador. Mismo plan de $200/mes, cero coste extra de API.

Ver el hilo

OneContext: contexto persistente entre sesiones y agentes

Una herramienta que gestiona automáticamente tu contexto entre sesiones de Claude Code y Codex. Abres un agente nuevo y ya recuerda todo sobre tu proyecto. Incluso puedes compartir el contexto por enlace para que otro continúe donde lo dejaste.

Ver el hilo

Baby continual learning en un Markdown

La idea es simple pero potente: haces que Codex tome notas de sus propios errores en un archivo del repo. Sesión a sesión, va consultando sus notas y mejorando. Para la quinta sesión es una herramienta diferente. Aprendizaje continuo casero, en un .md de tu portátil.

Ver el hilo


Próxima edición de AI Expert

En AI Expert enseñamos exactamente esto: cómo montar flujos de desarrollo agéntico con herramientas reales, entendiendo cómo funcionan por debajo. Ya estamos cubriendo plazas para la edición de mayo.

Toda la información aquí


Un abrazo,

Antonio.