Anthropic ha presentado oficialmente Mythos Preview, un nuevo y poderoso modelo de IA con capacidades avanzadas de ciberseguridad, junto con una iniciativa masiva en toda la industria llamada Proyecto Glasswing. En una medida inusual, la startup de inteligencia artificial se está asociando con sus principales competidores, incluidos Google, Microsoft y Apple, para garantizar que la próxima generación de herramientas de inteligencia artificial sirva como un escudo para la infraestructura digital en lugar de un arma para los piratas informáticos.
El auge de las capacidades cibernéticas “accidentales”
El desarrollo de Mythos Preview destaca una tendencia importante en la inteligencia artificial: capacidades emergentes. El director ejecutivo de Anthropic, Dario Amodei, señaló que el modelo no fue diseñado específicamente para piratería; más bien, fue entrenado para ser excepcionalmente competente en codificación.
Como subproducto directo de su destreza en codificación, el modelo ha adquirido la capacidad de realizar tareas complejas de ciberseguridad, como:
– Descubrimiento de vulnerabilidades: Identificación de debilidades en el software.
– Desarrollo de exploits: Creación de “pruebas de concepto” para demostrar cómo se puede vulnerar un sistema.
– Pruebas de penetración: Simulación de ataques para probar las defensas.
– Análisis binario: Evaluación de software sin necesidad de acceder a su código fuente original.
Esto crea un juego del “gato y el ratón” de alto riesgo. Si bien estas herramientas pueden ayudar a los defensores a encontrar y corregir errores más rápidamente, también brindan a los delincuentes la capacidad de automatizar ataques sofisticados que antes eran demasiado difíciles o costosos de ejecutar.
Proyecto Glasswing: una defensa colaborativa
Al reconocer el riesgo, Anthropic ha formado el Proyecto Glasswing, un consorcio diseñado para preparar el ecosistema tecnológico global para un mundo de IA altamente capaz. El grupo incluye más de 40 organizaciones, que van desde gigantes tecnológicos como Nvidia y Amazon Web Services hasta instituciones financieras y de infraestructura crítica.
La estrategia detrás de esta colaboración es doble:
1. Mitigación de vulnerabilidades: Al brindar a los desarrolladores de plataformas fundamentales (como Microsoft y Google) acceso privado a Mythos Preview, pueden usar el modelo para encontrar vulnerabilidades en sus propios sistemas y parchearlas antes de que el modelo se lance al público en general.
2. Estandarización de la defensa: El grupo tiene como objetivo redefinir los paradigmas de seguridad. Como explicó Logan Graham, líder del equipo rojo fronterizo de Anthropic, los supuestos de seguridad actuales pueden romperse en los próximos 6 a 24 meses a medida que estas capacidades estén ampliamente disponibles.
“Hemos visto a Mythos Preview lograr cosas que un investigador de seguridad senior podría lograr”, dice Graham. “Si no se hace con cuidado, esto podría ser un acelerador significativo para los atacantes”.
Encontrar los errores “inencontrables”
Los beneficios potenciales de esta colaboración ya se están haciendo realidad. Anthropic informa que Mythos Preview ya ha descubierto miles de vulnerabilidades críticas, incluidos ciertos errores que no habían sido detectados en un código altamente analizado durante décadas.
Para empresas como Microsoft, el objetivo es utilizar la IA para ampliar la defensa. El CISO global de Microsoft, Igor Tsyganskiy, señaló que a medida que la ciberseguridad va más allá de la capacidad puramente humana, la IA ofrece una oportunidad “sin precedentes” para reducir el riesgo a escala global.
El camino por delante
El Proyecto Glasswing se encuentra actualmente en sus primeras etapas. Para que la iniciativa tenga éxito, debe ir más allá de un pequeño círculo de empresas de tecnología y evolucionar hacia un estándar global más amplio sobre cómo se gestiona la seguridad impulsada por la IA. El desafío central sigue siendo: identificar las preguntas críticas sobre la seguridad de la IA y encontrar respuestas antes de que la tecnología supere nuestra capacidad para defendernos de ella.
Conclusión
Al reunir a los competidores en el marco del Proyecto Glasswing, Anthropic intenta convertir una posible crisis de seguridad en un esfuerzo de defensa coordinado. El objetivo es garantizar que a medida que la IA se vuelve más capaz de descifrar el software, sea igualmente capaz de protegerlo.
