El fallo que solo la inteligencia artificial descubrió

5 Min. de lectura

En un consorcio llamado Project Glasswing, un modelo de IA descubrió en primavera vulnerabilidades que los revisores humanos habían pasado por alto. El mismo modelo que cierra estas brechas también podría encontrarlas para explotarlas. Este problema de doble uso obliga a Anthropic a establecer accesos escalonados y a los equipos SOC a adoptar un nuevo modelo de amenazas.

Lo más importante en resumen

La capacidad es real. Los modelos Mythos de Anthropic lideran en tareas de seguridad y encuentran en programas como Project Glasswing vulnerabilidades que los humanos pasan por alto.
Defensa y ataque son la misma fortaleza. Quien encuentra brechas de forma fiable, también puede explotarlas. Precisamente por eso, Anthropic escalona el acceso y redirige las solicitudes de riesgo a un modelo más débil.
El modelo de amenazas cambia. Los equipos SOC deberían contar con atacantes que busquen con la misma velocidad de IA que la defensa.

Relacionado:Priorización de parches: por qué el CVSS solo satura tu SOC / Concienciación en seguridad: la tasa de clics mide lo equivocado

¿Qué es el doble uso en modelos de IA? El doble uso se refiere a una capacidad que puede emplearse tanto para defender como para atacar. Un modelo de IA que encuentra vulnerabilidades para cerrarlas puede usar esa misma capacidad para explotarlas. El resultado lo decide la intención del usuario.

Qué ocurrió en Project Glasswing

Cuando Anthropic presentó sus modelos Mythos en abril, el primer paso no fue un producto para todo el mundo. La empresa retuvo la variante más potente y la introdujo en un consorcio: Project Glasswing. Allí, empresas seleccionadas utilizan el modelo para encontrar y cerrar vulnerabilidades de software antes de que los atacantes las descubran.

Los resultados fueron la razón de la cautela. Un sistema que detecta fallos de seguridad más rápido y a fondo que un equipo experimentado es una herramienta de defensa poderosa. Una herramienta así requiere una distribución controlada.

El núcleo del problema

Un modelo que encuentra vulnerabilidades sirve tanto para la defensa como para el ataque. La búsqueda es la misma, solo cambia el objetivo.

Por qué la misma capacidad actúa en ambas direcciones

Los tests de penetración y los ataques siempre han utilizado las mismas técnicas, solo que con intenciones distintas. En un modelo que detecta vulnerabilidades a gran escala, esta antigua tensión se convierte en un problema concreto de control.

La respuesta de Anthropic es la escalonación. La variante de acceso amplio deriva automáticamente las solicitudes de mayor riesgo en ciberseguridad, biología y química a un modelo más débil, en lugar de responderlas por sí misma. La versión más potente queda reservada a un círculo reducido de defensores e infraestructuras críticas, en parte en colaboración con organismos estatales.

Abril 2026
El mito se hace público, pero su lanzamiento al público general se retrasa. Comienza el Project Glasswing.

Primavera 2026
El modelo detecta en el consorcio vulnerabilidades que habían pasado desapercibidas para los revisores humanos.

Junio 2026
La variante más potente se entrega a un grupo reducido de defensores de ciberseguridad, mientras que la versión amplia deriva las solicitudes de riesgo.

La situación en cifras

15+

Países donde se prueban modelos Mythos en infraestructuras críticas

80 %

del código fusionado por Anthropic procede, según sus datos, de Claude

niveles de acceso separan el uso general de la capacidad completa de seguridad

Qué implica esto para los equipos SOC

La consecuencia práctica no es motivo de pánico, pero sí de preparación. Si los defensores encuentran vulnerabilidades a la velocidad de la IA, los equipos de seguridad deben asumir que los atacantes buscarán la misma ventaja. La ventana de tiempo entre el descubrimiento de una vulnerabilidad y su explotación tenderá a acortarse.

Para el modelo de amenazas propio, esto significa: ciclos de parcheo más rápidos, una vigilancia más estrecha de las interfaces expuestas y la suposición de que la búsqueda automatizada se convertirá en la norma, en ambos bandos. Marcos de gobernanza como NIS2 exigen ya capacidad de reacción demostrable. La búsqueda asistida por IA convierte esta obligación en una auténtica cuestión de velocidad.

Preguntas frecuentes

¿Qué es el doble uso en los modelos de IA?

El doble uso describe una capacidad que puede emplearse tanto con fines defensivos como ofensivos. Un modelo que detecta vulnerabilidades para corregirlas puede usar esa misma capacidad para explotarlas. El daño o el beneficio dependen de la intención del usuario.

¿Qué es el Project Glasswing?

Un consorcio en el que empresas seleccionadas utilizan el modelo Mythos de Anthropic para detectar y corregir vulnerabilidades de software. Fue la vía controlada para emplear la potente capacidad de seguridad sin hacerla accesible de forma generalizada.

¿Por qué el modelo de acceso amplio deriva las solicitudes de riesgo?

La variante de uso general redirige los temas de mayor riesgo en ciberseguridad, biología y química a un modelo más débil. Así se puede ofrecer toda la potencia donde no es crítico y limitarla donde existe riesgo de abuso.

¿Significa esto más ataques contra mi empresa?

No necesariamente más, pero sí potencialmente más rápidos. Si la búsqueda automatizada se convierte en la norma, se reducirá el tiempo entre el descubrimiento de una vulnerabilidad y su explotación. La velocidad de parcheo y la visibilidad de las propias interfaces ganarán importancia.

¿Qué debe hacer ahora concretamente un equipo SOC?

Inventariar interfaces expuestas, basar la priorización de parches en la explotabilidad real en lugar de solo en puntuaciones y ampliar el propio modelo de amenazas con atacantes capaces de usar IA. Lo decisivo es la rapidez con la que reacciona un equipo.

Más del MBF Media Netzwerk

cloudmagazin

Para el canal TI, la IA ya no es un campo de juegos

mybusinessfuture

Cuando la actualización se convierte en la puerta de entrada

digital-chiefs

Golden Gate: Apple convierte la IA en su foso defensivo

Fuente de la imagen: generada por IA (junio 2026), certificado C2PA incluido en la imagen

Imprimir artículo