Inteligencia artificial local como estrategia de seguridad: qué significa Gemma 4 para la protección de datos según el RGPD
7 min de tiempo de lectura
Cada solicitud a un servicio de inteligencia artificial en la nube es una transferencia de datos a un proveedor externo. Con modelos de código abierto como Gemma 4 de Google, es posible ejecutar la inteligencia artificial por primera vez en calidad de producción completa On-Premise. Para los equipos de seguridad, esto cambia la evaluación de riesgos fundamentalmente: no hay fuga de datos, no hay dependencia de proveedores externos, no hay zona gris de cumplimiento.
Lo más importante en resumen
- Los servicios de inteligencia artificial en la nube transfieren datos de la empresa en cada solicitud a servidores en EE. UU. o China, un riesgo permanente para la confidencialidad y el cumplimiento.
- Gemma 4 de Google (licencia Apache-2.0) se ejecuta completamente de forma local y alcanza valores de referencia al nivel de modelos mucho más grandes.
- La inteligencia artificial On-Premise elimina la fuga de datos a terceros y simplifica el cumplimiento de la RGPD: no hay transferencia a un país tercero, no se necesita un Acuerdo de Procesamiento de Datos.
- Para las empresas sujetas a NIS2, la inteligencia artificial local reduce el área de ataque: no hay interfaces de API adicionales, no hay dependencia de la disponibilidad de servicios externos.
- Es posible el funcionamiento aislado: el modelo no necesita conexión a Internet después de la descarga.
El riesgo de la inteligencia artificial en la nube: cada solicitud es una transferencia de datos
Cuando un empleado resume un borrador de contrato con ChatGPT, clasifica una solicitud de soporte a través de un servicio de inteligencia artificial en la nube o analiza un documento interno, siempre sucede lo mismo: los datos abandonan la empresa. Se transfieren a servidores que generalmente se encuentran en EE. UU., en proveedores como OpenAI, Google o Anthropic.
Las alternativas chinas, como DeepSeek, agudizan el problema: aquí, los datos llegan a una jurisdicción cuyos estándares de privacidad son difíciles de verificar para las empresas europeas.
Para los equipos de seguridad de la información, esto no es una preocupación teórica. Los riesgos concretos son:
Pérdida de confidencialidad: La propiedad intelectual, los datos de los clientes, los documentos de estrategia interna y los secretos comerciales se hacen accesibles a un proveedor externo, independientemente de lo que se especifique en su política de privacidad. El control sobre el procesamiento de datos reside en el proveedor, no en la empresa.
Riesgo de cumplimiento: La transferencia de datos personales a países terceros requiere, según la RGPD, medidas de protección adicionales (cláusulas contractuales estándar, Evaluaciones de Impacto de la Transferencia). Muchas empresas utilizan la inteligencia artificial en la nube sin implementar formalmente estas medidas.
Riesgo de la cadena de suministro: Cada conexión de API a un servicio de inteligencia artificial en la nube es un área de ataque adicional. Las claves de API pueden ser comprometidas, el proveedor puede ser víctima de una violación de la seguridad, o la disponibilidad de la API puede fallar. Para las empresas sujetas a NIS2, cada una de estas dependencias es un punto que debe documentarse, evaluarse y supervisarse.
Gemma 4: lo que la inteligencia artificial local puede hacer ahora
Los modelos de código abierto ya existían. Lo que cambia con Gemma 4 es que los modelos son lo suficientemente pequeños para hardware estándar y lo suficientemente buenos para casos de uso productivos que anteriormente solo eran posibles a través de API en la nube.
El modelo denso de 31B ocupa el tercer lugar en la clasificación de texto de Arena AI (ELO 1452), detrás de modelos que requieren mucho más poder de cálculo. Admite llamadas a funciones, salida de JSON estructurado y procesa hasta 256.000 tokens de contexto. Las variantes más pequeñas (E2B, E4B) se ejecutan en teléfonos inteligentes y dispositivos IoT.
Todos los cuatro tamaños de modelo están bajo la licencia Apache-2.0. Esto significa: no hay restricciones para el uso comercial, no hay tarifas de licencia, no hay obligación de informar a Google. El modelo se puede descargar, transferir a un entorno sin conexión y ejecutarlo allí sin límites.
Evaluación de seguridad: lo que la inteligencia artificial On-Premise hace mejor
Para la evaluación de riesgos, hay tres aspectos decisivos:
Soberanía de datos: En la inferencia local, los datos no abandonan el ordenador. No hay llamada a API, no hay comunicación de red, no hay almacenamiento intermedio en servidores ajenos. Esto no es solo un argumento de privacidad, elimina una clase completa de vectores de ataque (hombre en el medio, compromiso de API, violación de un proveedor externo).
Área de ataque reducida: Las API de inteligencia artificial en la nube requieren autenticación por clave de API, comunicación regular a través de Internet y confianza en las medidas de seguridad del proveedor. La inteligencia artificial local no necesita nada de eso. En entornos aislados, se puede ejecutar un modelo local que no tiene acceso a la red.
«Gemma 4 se publica bajo la licencia Apache-2.0 comercialmente permisiva. Úsalo.»
– Google, anuncio de Gemma-4 (abril de 2026)
Simplificación del cumplimiento: Todo el complejo de la transferencia a un país tercero según el artículo 44-49 de la RGPD desaparece con el procesamiento local. No hay Evaluación de Impacto de la Transferencia, no hay cláusulas contractuales estándar, no hay Acuerdo de Procesamiento de Datos con un proveedor de EE. UU. Para los responsables de la RGPD, esto es un alivio masivo.
Relevancia para empresas sujetas a NIS2
NIS2 obliga a las empresas afectadas a evaluar los riesgos de su cadena de suministro completa, incluidos los servicios digitales. Cada proveedor de inteligencia artificial en la nube es un eslabón en esta cadena. Cada dependencia de API debe documentarse, el riesgo de fallo debe evaluarse y deben definirse medidas alternativas.
La inteligencia artificial local simplifica significativamente esta evaluación: no hay riesgo de cadena de suministro para este componente específico. La disponibilidad está completamente en manos del propio equipo de TI. Un fallo en OpenAI o Google no afecta a la propia infraestructura de inteligencia artificial.
Esto no significa que la inteligencia artificial local no tenga sus propios riesgos. El hardware debe mantenerse, los modelos deben actualizarse y el acceso debe controlarse. Pero estos riesgos son internamente controlables y, por lo tanto, más fáciles de representar en la documentación de NIS2 que las dependencias externas.
Qué no resuelve la inteligencia artificial On-Premise
La inteligencia artificial local no es una solución para todos los problemas. Tres limitaciones que los equipos de seguridad deben conocer:
Seguridad del modelo: Un modelo local puede alucinar, proporcionar salidas sesgadas o ser manipulado al igual que un modelo en la nube. La responsabilidad de la validación de la salida recae en el operador, sin la capa de seguridad que los proveedores de la nube suelen anteponer.
Gestión de actualizaciones: Los servicios de inteligencia artificial en la nube se actualizan centralmente. Con los modelos locales, la gestión de actualizaciones recae en el propio equipo. Los parches de seguridad para los marcos de inferencia (Ollama, vLLM) deben aplicarse oportunamente.
Control de acceso: Un modelo que se ejecuta localmente es solo tan seguro como la infraestructura en la que se ejecuta. Quien opera un servidor de inteligencia artificial local necesita control de acceso, registro y supervisión, las mismas medidas que se aplican a cualquier servicio interno.
Recomendación de acción para los equipos de seguridad
La combinación de calidad de producción, licencia Apache-2.0 y funcionamiento local hace que los modelos como Gemma 4 sean una opción seria para las empresas que desean utilizar la inteligencia artificial sin comprometer sus requisitos de seguridad.
Tres pasos concretos:
1. Auditoría del uso actual de la inteligencia artificial: ¿Dónde se utilizan actualmente las API de inteligencia artificial en la nube? ¿Qué datos se transfieren? ¿Se han implementado formalmente las medidas de privacidad (Acuerdo de Procesamiento de Datos, Evaluación de Impacto de la Transferencia)?
2. Piloto con Gemma 4 On-Premise: Identificar un caso de uso concreto (clasificación de documentos, triage de correo electrónico, revisión de código) y probar el modelo en hardware propio. Comparar la calidad y el rendimiento con el servicio en la nube.
3. Definir una arquitectura híbrida: Para qué tareas es suficiente la inteligencia artificial local. ¿Dónde sigue siendo necesaria la inteligencia artificial en la nube? Tomar la decisión de enrutamiento según la sensibilidad de los datos: datos confidenciales localmente, datos no críticos opcionalmente a través de API en la nube.
Preguntas frecuentes
¿Es la inteligencia artificial local automáticamente conforme con la RGPD?
La conformidad con la RGPD se refiere a la eliminación de la transferencia a un país tercero (artículo 44-49 de la RGPD). Las demás obligaciones de la RGPD (limitación de propósito, minimización de datos, derechos de los afectados, registro de actividades de procesamiento) siguen aplicándose, independientemente de si el procesamiento se realiza localmente o en la nube. La inteligencia artificial local simplifica el cumplimiento, pero no lo reemplaza.
¿Puede ser pirateado un modelo de inteligencia artificial local?
El modelo en sí es un archivo estático (pesos y configuración). No puede ser «pirateado» en el sentido clásico. Los escenarios de ataque afectan la infraestructura que lo rodea: inyección de comandos (entradas manipuladas que cambian el comportamiento del modelo), acceso al servidor en el que se ejecuta el modelo o manipulación de los archivos del modelo. Las medidas de protección son las mismas que para cualquier servicio interno: control de acceso, validación de entrada, verificación de integridad.
¿Debo hacer una evaluación de riesgos de inteligencia artificial según la Ley de Inteligencia Artificial de la UE, a pesar de todo?
Depende del propósito de uso, no del lugar de funcionamiento. Si el sistema de inteligencia artificial cae en un área de aplicación que la Ley de Inteligencia Artificial considera de alto riesgo (recursos humanos, concesión de créditos, infraestructura crítica), las obligaciones de documentación y gestión de riesgos se aplican, independientemente de si el modelo se ejecuta localmente o en la nube. La ventaja de la inteligencia artificial local: tiene control total sobre la documentación, el registro y el comportamiento del modelo.
¿Qué hardware necesita un equipo de seguridad para la inteligencia artificial local?
Para el modelo de 31B: una GPU con al menos 24 GB de VRAM (Nvidia RTX 4090 o similar) y 64 GB de RAM del sistema. Para el funcionamiento aislado: el modelo se descarga una vez en un ordenador con acceso a Internet, se copia en un USB o en una red y se instala en el ordenador de destino sin conexión a Internet. El funcionamiento en curso no requiere acceso a la red.
¿Cómo se compara la calidad de la respuesta con los servicios en la nube como ChatGPT?
Para tareas estándar (clasificación, resumen, extracción de datos, traducción), la calidad de Gemma 4 de 31B es comparable con los servicios en la nube actuales. En análisis complejos y aplicaciones muy creativas, los modelos de vanguardia de los proveedores de la nube todavía tienen ventaja. Para tareas específicas de seguridad (análisis de registros, generación de reglas, verificación de documentos), los primeros usuarios informan de resultados prácticos.
Fuente de la imagen de título: Pexels