El fallo que solo la inteligencia artificial descubrió
5 Min. de lectura
En un consorcio llamado Project Glasswing, un modelo de IA descubrió en primavera vulnerabilidades que los revisores humanos habían pasado por alto. El mismo modelo que cierra estas brechas también podría encontrarlas para explotarlas. Este problema de doble uso obliga a Anthropic a establecer accesos escalonados y a los equipos SOC a adoptar un nuevo modelo de amenazas.
Lo más importante en resumen
- La capacidad es real. Los modelos Mythos de Anthropic lideran en tareas de seguridad y encuentran en programas como Project Glasswing vulnerabilidades que los humanos pasan por alto.
- Defensa y ataque son la misma fortaleza. Quien encuentra brechas de forma fiable, también puede explotarlas. Precisamente por eso, Anthropic escalona el acceso y redirige las solicitudes de riesgo a un modelo más débil.
- El modelo de amenazas cambia. Los equipos SOC deberían contar con atacantes que busquen con la misma velocidad de IA que la defensa.
Relacionado:Priorización de parches: por qué el CVSS solo satura tu SOC / Concienciación en seguridad: la tasa de clics mide lo equivocado
Qué ocurrió en Project Glasswing
Cuando Anthropic presentó sus modelos Mythos en abril, el primer paso no fue un producto para todo el mundo. La empresa retuvo la variante más potente y la introdujo en un consorcio: Project Glasswing. Allí, empresas seleccionadas utilizan el modelo para encontrar y cerrar vulnerabilidades de software antes de que los atacantes las descubran.
Los resultados fueron la razón de la cautela. Un sistema que detecta fallos de seguridad más rápido y a fondo que un equipo experimentado es una herramienta de defensa poderosa. Una herramienta así requiere una distribución controlada.
Un modelo que encuentra vulnerabilidades sirve tanto para la defensa como para el ataque. La búsqueda es la misma, solo cambia el objetivo.
Por qué la misma capacidad actúa en ambas direcciones
Los tests de penetración y los ataques siempre han utilizado las mismas técnicas, solo que con intenciones distintas. En un modelo que detecta vulnerabilidades a gran escala, esta antigua tensión se convierte en un problema concreto de control.
La respuesta de Anthropic es la escalonación. La variante de acceso amplio deriva automáticamente las solicitudes de mayor riesgo en ciberseguridad, biología y química a un modelo más débil, en lugar de responderlas por sí misma. La versión más potente queda reservada a un círculo reducido de defensores e infraestructuras críticas, en parte en colaboración con organismos estatales.
El mito se hace público, pero su lanzamiento al público general se retrasa. Comienza el Project Glasswing.
El modelo detecta en el consorcio vulnerabilidades que habían pasado desapercibidas para los revisores humanos.
La variante más potente se entrega a un grupo reducido de defensores de ciberseguridad, mientras que la versión amplia deriva las solicitudes de riesgo.
Qué implica esto para los equipos SOC
La consecuencia práctica no es motivo de pánico, pero sí de preparación. Si los defensores encuentran vulnerabilidades a la velocidad de la IA, los equipos de seguridad deben asumir que los atacantes buscarán la misma ventaja. La ventana de tiempo entre el descubrimiento de una vulnerabilidad y su explotación tenderá a acortarse.
Para el modelo de amenazas propio, esto significa: ciclos de parcheo más rápidos, una vigilancia más estrecha de las interfaces expuestas y la suposición de que la búsqueda automatizada se convertirá en la norma, en ambos bandos. Marcos de gobernanza como NIS2 exigen ya capacidad de reacción demostrable. La búsqueda asistida por IA convierte esta obligación en una auténtica cuestión de velocidad.
Preguntas frecuentes
¿Qué es el doble uso en los modelos de IA?
El doble uso describe una capacidad que puede emplearse tanto con fines defensivos como ofensivos. Un modelo que detecta vulnerabilidades para corregirlas puede usar esa misma capacidad para explotarlas. El daño o el beneficio dependen de la intención del usuario.
¿Qué es el Project Glasswing?
Un consorcio en el que empresas seleccionadas utilizan el modelo Mythos de Anthropic para detectar y corregir vulnerabilidades de software. Fue la vía controlada para emplear la potente capacidad de seguridad sin hacerla accesible de forma generalizada.
¿Por qué el modelo de acceso amplio deriva las solicitudes de riesgo?
La variante de uso general redirige los temas de mayor riesgo en ciberseguridad, biología y química a un modelo más débil. Así se puede ofrecer toda la potencia donde no es crítico y limitarla donde existe riesgo de abuso.
¿Significa esto más ataques contra mi empresa?
No necesariamente más, pero sí potencialmente más rápidos. Si la búsqueda automatizada se convierte en la norma, se reducirá el tiempo entre el descubrimiento de una vulnerabilidad y su explotación. La velocidad de parcheo y la visibilidad de las propias interfaces ganarán importancia.
¿Qué debe hacer ahora concretamente un equipo SOC?
Inventariar interfaces expuestas, basar la priorización de parches en la explotabilidad real en lugar de solo en puntuaciones y ampliar el propio modelo de amenazas con atacantes capaces de usar IA. Lo decisivo es la rapidez con la que reacciona un equipo.
Más del MBF Media Netzwerk
Cuando la actualización se convierte en la puerta de entrada
Fuente de la imagen: generada por IA (junio 2026), certificado C2PA incluido en la imagen