Actualizado Martes, 7 abril 2026 - 22:50Anthropic tiene un nuevo modelo de inteligencia artificial. Uno que, seg�n la compa��a, es tan avanzado y capaz que no va a estar disponible para el p�blico general.
Claude Mythos, que es como se conoce internamente, estar� s�lo disponible para 40 organizaciones y s�lo podr�n usarlo para tareas de ciberseguridad. El resto tendr� que esperar y no est� claro durante cu�nto tiempo.La noticia llega semanas despu�s de que el propio modelo se filtrara por accidente. En marzo, un fallo de configuraci�n en el sistema de gesti�n de contenidos de
Anthropic dej� al descubierto casi 3.000 archivos internos, incluido el borrador de un blog en el que la empresa lo describ�a como "con diferencia el modelo de IA m�s potente que hemos desarrollado jam�s".
Anthropic confirm� la existencia del modelo, habl� de un "error humano" y retir� el acceso.Pero los documentos filtrados revelaban que Mythos no es simplemente una versi�n mejorada de
Claude Opus 4.6, el modelo m�s avanzado que
Anthropic comercializa actualmente. La empresa lo encuadra en una categor�a propia que denomin� internamente Capybara. Es un nivel superior al Opus, m�s caro de ejecutar y, seg�n sus propias evaluaciones, cualitativamente diferente.El problema que presenta, seg�n la compa��a, es que es tan eficiente encontrando fallos y vulnerabilidades de software que permite el acceso indiscriminado, seg�n la compa��a, ser�a peligroso. En
CyberGym, el principal banco de pruebas para medir la capacidad de un sistema de IA en tareas de an�lisis de vulnerabilidades,
Claude Mythos alcanza el 83,1%. Opus 4.6, que hasta ahora lideraba ese ranking, se quedaba en el 66,6%. Son 16 puntos de diferencia en una m�trica que los profesionales de seguridad inform�tica consideran especialmente dif�cil de escalar.
Logan Graham, responsable del equipo de red team de
Anthropic (un grupo interno centrado en estudiar los peligros de los modernos sistemas de inteligencia artificial), describe Mythos como equivalente a un investigador de seguridad muy avanzado. Puede encontrar "decenas de miles de vulnerabilidades" que un experto humano dif�cilmente detectar�a y, a diferencia de modelos anteriores, tambi�n es capaz de escribir el c�digo que las aprovechan. Lo hace, ademas, en minutos.En pruebas internas, Opus 4.6 identific� alrededor de 500 vulnerabilidades conocidas como "de d�a cero" (desconocidas con anterioridad por los responsables) en software de c�digo abierto. Mythos, durante las semanas de prueba interna, encontr� miles de ellas, muchas con una antig�edad de entre diez y veinte a�os que hab�an permanecido indetectables.GLASSWINGPara evitar que, al lanzar el modelo al p�blico, miles de aplicaciones cr�ticas de seguridad resulten vulnerables,
Anthropic ha decidido limitar el despliegue a un grupo reducido de 40 empresas que s�lo podr� usarlo para crear las defensas necesarias en la mayor�a de aplicaciones y programas que se usan a diario. Este esfuerzo se conocer� como Project Glasswing y la lista de empresas incluye a doce socios fundacionales de
Anthropic: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, Nvidia y Palo Alto Networks.Utilizar�n Mythos para analizar sus propios sistemas y el software de c�digo abierto del que dependen, y compartir�n sus conclusiones con el resto de la industria.
Anthropic aportar� hasta 100 millones de d�lares en cr�ditos de uso y 4 millones adicionales para organizaciones de seguridad de c�digo abierto como OpenSSF y la Apache Software Foundation.Dario Amodei, CEO de
Anthropic, justific� la decisi�n no s�lo por los problemas que Mythos podr�a ocasionar, sino porque el resto de la industria no est� lejos de tener modelos similares. "Vamos a ver modelos de lenguaje m�s potentes, nuestros y de otros, y necesitamos un plan para responder a eso", ha explicado en un v�deo publicado junto al anuncio de Project Glasswing.
Anthropic, en consecuencia, no ha fijado una fecha para un lanzamiento p�blico de Mythos. La empresa reconoce que en cualquier caso el modelo es hoy en d�a "muy caro de ejecutar" y trabajar� en mejorar su eficiencia antes de cualquier despliegue general.