La IA de Anthropic ya genera la mayor parte de su propio código y avanza hacia la automejora recursiva

"En mayo de 2026, más del 80% del código que integramos en la base de código de Anthropic fue creado por Claude". Este dato fue revelado por dos investigadores de Anthropic, quienes publicaron un texto crucial sobre el presente y futuro de los modelos de IA de la empresa. Dicho informe aborda un concepto igualmente fascinante e inquietante: la automejora recursiva.

Multiplicador de código. El impacto de estas herramientas de programación agéntica en el trabajo de los ingenieros de Anthropic es notable. Según datos internos de Anthropic de mayo de 2026, la generación autónoma de código ha llevado a que un ingeniero de la compañía produzca ocho veces más líneas de código por trimestre que en el periodo 2021-2025. Los programadores humanos de Anthropic ahora dirigen y revisan el código generado por la IA, en lugar de programar directamente.

Una evolución frenética. En Anthropic, explican que los cambios han sido fascinantes. Entre 2021 y 2023, los ingenieros escribían todo el código manualmente. En 2024, comenzaron a utilizar chatbots para generar pequeños fragmentos de código que luego copiaban y pegaban. En 2025, surgieron agentes capaces de trabajar de forma autónoma sobre archivos completos.

Más tiempo seguido. Según el benchmark METR, que mide la capacidad de la IA para completar tareas complejas, en 2022 GPT-3.5 apenas podía operar de forma autónoma durante unos 35 segundos sin cometer errores graves. A mediados de 2026, Claude Opus 4.6 ya es capaz de trabajar 16 horas seguidas en tareas complejas. En Anthropic, señalan que la duración de las tareas que un modelo de IA podía acometer se duplicaba cada siete meses, pero ahora lo hace cada cuatro. Si esta tendencia se mantiene, "tareas que le llevan a una persona días podrían automatizarse con IA. En 2027, los sistemas de IA podrían ser capaces de trabajar en tareas que le llevan a una persona semanas".

Rendimiento sobrehumano. Los benchmarks de la industria están siendo "saturados" por los nuevos modelos de IA, que ya alcanzan casi el 100% de la puntuación posible en muchos de ellos. Por ejemplo, SWE-bench, que medía la capacidad de los modelos para programar, ya casi está superado por los modelos más recientes. En 2025, Claude Opus lograba optimizar el código que se le proporcionaba, haciendo que corriese 3 veces más rápido. En abril de 2026, Claude Mythos Preview lograba una aceleración de ese código de 52 veces.

La IA que se mejoraba a sí misma. Este concepto de automejora recursiva plantea un escenario en el que un modelo de IA genera datos, corrige sus propios fallos y se entrena a sí mismo de forma continua. Esto abre la puerta a un crecimiento exponencial de sus capacidades, pero al mismo tiempo reabre un debate sobre los riesgos que este tipo de evolución genera.

Bucle infinito. Tradicionalmente, los ingenieros humanos analizaban las respuestas de un modelo, limpiaban los datos y ajustaban los parámetros para crear la siguiente versión de ese modelo. Con la automejora recursiva, la IA asume ese papel y evalúa su propio rendimiento, generando problemas más complejos para ponerse a prueba y creando datos sintéticos para su siguiente generación.

Peligro. Esa autonomía implica un riesgo potencial: que los humanos perdamos el control de la dirección de la IA. Que no sepamos o podamos asegurar si está alineada con nuestra ética e ideales. Los sesgos, por pequeños que sean, pueden amplificarse con este tipo de proceso iterativo, y el propio modelo podría haber mutado sus mecanismos de razonamiento ético y sus protocolos de seguridad originales, convirtiéndolos en algo totalmente impredecible. El escenario Terminator.

Aislamiento y arbitraje. Para evitar estos riesgos, en Anthropic implementan esa evolución en entornos aislados para luego verificar que todo funcione correctamente. Además, la empresa utiliza modelos de evaluación independientes que actúan como árbitros, auditando los modelos que evolucionan por sí mismos. Lo hacen comprobando cada cambio en el código para evitar que su impacto sea nocivo para el sistema o para sus usuarios.

El nuevo cuello de botella es el ser humano. La ley de Amdahl es una fórmula que se utiliza para hallar la mejora máxima de rendimiento de un sistema de información cuando solo una parte de ese sistema se mejora. En Anthropic, señalan cómo, a medida que la IA no para de escribir más y más código, el verdadero cuello de botella es el ser humano que tiene que revisar ese código.