El modelo ya no basta

¡Hola DevExpert!

Esta semana no ha habido vídeo nuevo, así que no voy a forzar una sección de vídeo.

Lo que sí ha aparecido varias veces es otra cosa: estamos hablando mucho de modelos, pero cada vez se nota más que el producto real está en la herramienta, el contexto y todo lo que rodea al modelo.

TL;DR de esta semana:

Tema: Harness Engineering - otro nombre más, sí, pero también una forma útil de pensar cómo hacer que los LLMs trabajen mejor.
Codex: usar una máquina remota desde Codex, incluso tirando de cloudflared para ver una app local en la preview.
Google I/O: Android entra en Google AI Studio y Antigravity se reorganiza entre app, IDE y CLI.

El tema de la semana: el modelo ya no basta

Greg Brockman decía esta semana que el modelo por sí solo ya no es el producto.

Y me parece que resume bastante bien lo que estamos viendo estos días. Los modelos ya pueden hacer muchísimas cosas. La diferencia empieza a estar en dónde viven, qué herramientas tienen, cuánto contexto arrastran, cómo se revisa lo que hacen y qué fricción te quitan durante el día.

Por eso comentaba ayer que, ahora mismo, la experiencia que me ofrece Codex App no me la ofrece otro producto. No porque el modelo sea mágico, sino porque el entorno alrededor empieza a tener mucho peso.

Un ejemplo bastante tonto, pero útil: estuve de viaje, conectado desde el portátil a mi ordenador principal de casa con la nueva función de Control other devices de Codex. La preview local no funcionaba tal cual, porque la app estaba corriendo en la máquina remota. Así que terminé montando un túnel con cloudflared y usando Codex para desarrollar a muchos kilómetros de distancia.

No es una gran arquitectura. Es simplemente el tipo de apaño que, cuando funciona, te cambia el día.

También está el tema de Harness Engineering, que esta semana me pilló un poco traspuesto. El nombre suena a palabro nuevo, pero el fondo es importante: no basta con pedirle cosas a un LLM. Hay que construir el entorno que aumenta la confianza en sus salidas.

En la pieza de Martin Fowler que compartí dentro del hilo, Birgitta Böckeler habla de esto desde una idea muy práctica: si el sistema no es determinista, necesitas formas de controlar, comprobar y encauzar el resultado. Puede ser con contexto, tests, prompts, herramientas, límites, evaluaciones o procesos. Pero algo tiene que haber entre "haz esto" y "confío en que estará bien".

Y esto conecta con lo que está pasando en los productos. Google metió desarrollo Android nativo en Google AI Studio, y al mismo tiempo Antigravity se está reorganizando entre la app de agentes, el IDE y el nuevo CLI que sustituye a Gemini CLI.

Un poco de caos, sí. Pero también es una señal clara: nadie quiere quedarse solo en el modelo. Todos están intentando construir el sitio desde el que realmente trabajas.

Lo que ha pasado esta semana

Harness Engineering

Recopilé varios recursos para entender mejor el concepto y monté incluso un NotebookLM con el material. Me parece una buena forma de agrupar algo que ya veníamos haciendo con AGENTS.md, skills, MCPs, tests, reglas y verificaciones: preparar el sistema para que la IA pueda trabajar con menos supervisión, pero no a ciegas.

Codex en remoto con cloudflared

La función de controlar otros dispositivos abre un caso bastante potente: trabajar desde un portátil contra una máquina principal. La preview local todavía no resuelve todos los escenarios, pero con un túnel temporal se puede salvar.

Antigravity 2

Google ha separado un poco más las piezas: Antigravity IDE, Antigravity como app de agentes y Antigravity CLI. Hay nombres que ayudan poco, pero la dirección es la misma: más agentes, más herramientas, más superficie fuera del editor clásico.

Android en Google AI Studio

Google enseñó soporte para desarrollo Android nativo desde Google AI Studio. Esto habrá que probarlo bien, porque si encaja con flujos reales puede ser relevante para quien trabaja con Android y no quiere vivir solo dentro del IDE.

Lecturas recomendadas

Meeting recorder local para Mac

Una utilidad para grabar y transcribir reuniones desde el audio del sistema, sin plugins ni extensiones, y transcribiendo en local en Macs modernos. De esas herramientas pequeñas que pueden acabar encajando muy bien en un flujo de trabajo diario.

Skills de marketing en Codex

Riley Brown enseñó varias skills y plugins que usa para contenido y marketing dentro de Codex. No lo metería todo en mi flujo tal cual, pero sirve para ver cómo se está expandiendo Codex más allá de programar.

Grep vs Vector Search

Buen recordatorio de que no siempre hace falta montar un RAG complejo. Para muchos casos, retrieval más simple y bien integrado puede ser suficiente, sobre todo si forma parte de un harness que sabes controlar.

Próxima edición de AI Expert

Todo esto es justo lo que trabajamos dentro de AI Expert: no solo "usar IA", sino construir flujos donde la IA tenga contexto, herramientas, validación y un sitio claro dentro del trabajo real.

Toda la información aquí

Un abrazo,

Antonio.