Claude Mythos está cerca: La IA más polémica de Anthropic podría llegar en semanas

Cerebro digital en cubo de cristal iluminado en un centro de datos, con programador trabajando en segundo plano.

Anthropic ha confirmado que Claude Mythos, su modelo de inteligencia artificial más potente y también el más polémico hasta la fecha, podría estar disponible para más clientes “en las próximas semanas”.

La noticia llega en paralelo al lanzamiento de Claude Opus 4.8, pero toda la atención se ha centrado en Mythos por una razón muy concreta: sus capacidades avanzadas en ciberseguridad.

Claude Mythos se acerca a su lanzamiento público

Anthropic parece estar lista para abrir el acceso a Claude Mythos más allá del reducido grupo de empresas, investigadores y organismos que han podido probarlo hasta ahora. Según Reuters, la compañía prepara el despliegue del modelo en cuestión de semanas, aunque todavía no ha detallado qué clientes podrán usarlo ni bajo qué limitaciones.

La noticia es importante porque Mythos no es simplemente una versión más rápida o más precisa de Claude. Se trata de un modelo diseñado para tareas de ciberseguridad de alto nivel, capaz de analizar sistemas complejos, detectar vulnerabilidades y asistir en investigaciones técnicas que hasta ahora requerían equipos humanos muy especializados.

Anthropic ya había reconocido oficialmente la existencia de Claude Mythos Preview dentro de Project Glasswing, una iniciativa con acceso restringido e invitación previa. En su documentación, la compañía describe Mythos Preview como un modelo de investigación enfocado a flujos de trabajo defensivos de ciberseguridad, sin registro abierto ni acceso autoservicio.

Qué es Claude Mythos y por qué genera tanta inquietud

Claude Mythos es un modelo de frontera situado por encima de la familia Opus actual. Mientras Claude Opus 4.8 se presenta como el nuevo modelo insignia para programación, razonamiento, tareas profesionales y agentes autónomos, Mythos juega en otra categoría por sus capacidades específicas en seguridad informática.

La preocupación no viene solo de que Mythos pueda escribir código o resolver problemas técnicos. El punto delicado es que, según evaluaciones externas y reportes publicados en las últimas semanas, el modelo puede ayudar a encontrar vulnerabilidades reales en software complejo y participar en cadenas de análisis que antes estaban reservadas a expertos en seguridad ofensiva.

El Instituto de Seguridad de IA del Reino Unido evaluó Claude Mythos Preview en un entorno controlado y destacó su capacidad para completar una simulación de ataque corporativo de 32 pasos. The Guardian también recogió que el modelo fue capaz de resolver esa prueba de extremo a extremo en algunos intentos, algo que lo situaría por delante de otros modelos disponibles.

Dicho de forma sencilla: Mythos no solo responde preguntas sobre ciberseguridad, sino que puede ayudar a encadenar pasos complejos dentro de una investigación técnica. Eso lo convierte en una herramienta muy valiosa para defensores, pero también en un riesgo evidente si termina en manos equivocadas.

Project Glasswing: el acceso controlado antes de abrir la puerta

Desde abril, Anthropic ha mantenido Claude Mythos Preview dentro de Project Glasswing, una iniciativa orientada a reforzar la seguridad del software crítico antes de que capacidades similares se generalicen en el mercado.

La propia página de noticias de Anthropic describe Project Glasswing como una colaboración con compañías y organizaciones como Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks, entre otras. El objetivo es utilizar el modelo para localizar y corregir fallos en software clave antes de que atacantes puedan explotar herramientas similares.

La idea de fondo es razonable: si una IA puede encontrar vulnerabilidades a gran velocidad, lo mejor es que los defensores la usen primero. El problema es que este planteamiento también abre un debate incómodo. Cuanto más poderosa sea la herramienta, más difícil resulta justificar cuándo y cómo debe ponerse en manos de más usuarios.

Por ahora, Anthropic no ha explicado con precisión qué barreras adicionales está preparando para un despliegue más amplio. Tampoco está claro si Mythos llegará a todos los clientes de Claude, solo a empresas verificadas o únicamente a organizaciones con necesidades defensivas concretas.

El caso Mozilla y las vulnerabilidades en Firefox

Uno de los ejemplos que más ha contribuido a aumentar la preocupación alrededor de Mythos es su uso en navegadores web. Diversos informes han señalado que el modelo ayudó a identificar un gran número de vulnerabilidades en Firefox durante evaluaciones internas de seguridad.

El dato de las 271 vulnerabilidades aparece citado en varias recopilaciones y fuentes secundarias, aunque no siempre con el mismo grado de detalle público. The Wall Street Journal, en una información sobre Mythos y Apple, señaló que el modelo había identificado más de 100 fallos críticos en Firefox en dos semanas, lo que ya da una idea del tipo de capacidad que está sobre la mesa.

En cualquier caso, el mensaje es el mismo: este tipo de modelos puede acelerar enormemente la búsqueda de fallos. Para Mozilla, Apple, Microsoft, Google o cualquier compañía que mantenga software usado por millones de personas, eso puede ser una bendición o una pesadilla, dependiendo de quién tenga acceso al modelo.

El episodio de Apple M5 elevó aún más la tensión

El caso más llamativo de las últimas semanas llegó de la mano de Calif, una firma de ciberseguridad que aseguró haber usado Claude Mythos Preview para desarrollar en apenas cinco días una cadena de explotación contra macOS en hardware Apple M5. La compañía publicó un resumen de su investigación, y medios como TechRadar, Tom’s Hardware y The Wall Street Journal recogieron el caso.

Conviene no entrar en detalles técnicos que puedan facilitar un uso indebido, pero el caso es relevante porque afectaba a mecanismos de seguridad avanzados de Apple y demostraba cómo una IA especializada puede acelerar el trabajo de investigadores humanos.

Este matiz es importante. Mythos no elimina necesariamente la necesidad de expertos, pero sí puede cambiar la velocidad a la que esos expertos trabajan. En ciberseguridad, reducir semanas de análisis a unos pocos días puede tener consecuencias enormes.

Para los equipos defensivos, significa encontrar y parchear antes. Para los atacantes, si acceden a herramientas comparables, significa descubrir caminos de ataque con mucha menos fricción.

Claude Opus 4.8 queda eclipsado por Mythos

Anthropic también ha lanzado Claude Opus 4.8, una actualización importante de su familia Opus. La compañía destaca mejoras en programación, tareas agénticas, uso de herramientas, razonamiento y trabajos profesionales de larga duración. También asegura que el modelo es más “honesto”, en el sentido de que tiende más a reconocer incertidumbres y menos a presentar avances no verificados como si fueran seguros.

Según Anthropic, Opus 4.8 es alrededor de cuatro veces menos propenso que su predecesor a dejar pasar sin comentario fallos en el código que ha generado. La compañía también afirma que su evaluación de alineamiento muestra menores tasas de comportamientos problemáticos frente a Claude Opus 4.7, con resultados cercanos a Claude Mythos Preview en algunos apartados de seguridad.

Aun así, el lanzamiento de Opus 4.8 ha quedado en segundo plano. En un ciclo normal, una mejora de este tipo habría sido noticia por sí sola. Pero Mythos ha cambiado el foco de la conversación: ya no se trata solo de qué modelo escribe mejor código, sino de qué ocurre cuando una IA puede ayudar a encontrar fallos críticos en infraestructuras reales.

OpenAI y Anthropic chocan por el discurso del riesgo

El debate no se limita a Anthropic. Sam Altman, CEO de OpenAI, criticó recientemente el enfoque de su competidor y lo calificó como una forma de “marketing basado en el miedo”. Altman sugirió que presentar un modelo como demasiado peligroso para el público puede servir también para justificar un acceso limitado y controlado por unas pocas empresas.

La crítica toca un punto sensible. Por un lado, las compañías de IA tienen razones legítimas para no abrir de golpe herramientas con capacidades ofensivas. Por otro, también existe el riesgo de que el discurso de la seguridad se utilice como ventaja comercial: “nuestro modelo es tan potente que solo unos pocos pueden usarlo”.

Anthropic, por su parte, ha mantenido una postura más cauta con Mythos. La compañía insiste en que el modelo debe probarse primero en entornos defensivos y bajo condiciones controladas. Esa prudencia puede parecer exagerada a algunos competidores, pero los resultados conocidos hasta ahora explican por qué muchos expertos prefieren ir despacio.

El gran dilema: defensa más rápida o ataque más fácil

La llegada de Mythos plantea una pregunta que la industria tecnológica no puede esquivar: ¿qué ocurre cuando las mismas herramientas que permiten proteger sistemas también pueden servir para atacarlos?

En teoría, modelos como Claude Mythos pueden ser una revolución positiva. Podrían ayudar a revisar millones de líneas de código, encontrar fallos antiguos, priorizar parches, generar informes para equipos de seguridad y reducir el tiempo entre el descubrimiento de una vulnerabilidad y su corrección.

Pero la otra cara es evidente. Si estas capacidades se democratizan demasiado rápido, grupos maliciosos podrían usarlas para acelerar campañas contra empresas, administraciones públicas o servicios esenciales. La seguridad informática siempre ha sido una carrera entre atacantes y defensores, pero la IA puede aumentar drásticamente la velocidad de ambos bandos.

Por eso el despliegue de Mythos será observado con lupa. No solo por clientes empresariales, sino también por gobiernos, reguladores, investigadores de seguridad y competidores directos de Anthropic.

Qué puede pasar si Mythos llega a más usuarios

Si Anthropic abre Claude Mythos en las próximas semanas, lo más probable es que no lo haga como un producto de consumo convencional. Sería extraño ver un acceso libre e idéntico para cualquier usuario, especialmente teniendo en cuenta que la propia documentación actual lo mantiene como una vista previa de investigación con acceso por invitación.

Lo más razonable sería un despliegue por niveles: clientes empresariales verificados, uso limitado a tareas defensivas, entornos controlados, auditorías, registros de actividad y restricciones sobre determinadas operaciones. Anthropic no ha confirmado todavía este esquema, pero encajaría con la forma en la que la compañía ha gestionado Mythos hasta ahora.

También es posible que Mythos llegue primero integrado en herramientas concretas, como entornos de análisis de código o plataformas de seguridad, en lugar de aparecer como un chatbot abierto en Claude.ai. Eso permitiría ofrecer sus ventajas sin liberar todas sus capacidades en una interfaz generalista.

Una nueva etapa para la IA y la ciberseguridad

Claude Mythos puede marcar un antes y un después en la relación entre inteligencia artificial y ciberseguridad. Hasta ahora, muchos modelos eran útiles para explicar conceptos, revisar código o ayudar a automatizar tareas. Mythos apunta a algo más profundo: IA capaz de participar en investigaciones complejas sobre vulnerabilidades reales.

Eso no significa que el mundo vaya a romperse de la noche a la mañana. Los expertos siguen siendo necesarios, los sistemas bien protegidos no caen automáticamente y muchas amenazas siguen dependiendo de fallos conocidos, malas configuraciones o parches que nunca se instalan.

Pero sí cambia el equilibrio. Si una IA puede ayudar a descubrir más fallos, más rápido y con menos intervención humana, todas las organizaciones que desarrollan o dependen de software tendrán que adaptarse. Los ciclos de parcheo deberán acelerarse, las auditorías tendrán que ser más frecuentes y la seguridad dejará de ser una fase final del desarrollo para convertirse en una carrera continua.

Anthropic tiene ahora una decisión delicada por delante. Abrir Mythos demasiado pronto podría multiplicar los riesgos. Mantenerlo cerrado demasiado tiempo podría concentrar una capacidad enorme en manos de unos pocos actores. En ambos casos, el debate ya no es teórico: la próxima generación de IA no solo responderá preguntas, también podrá encontrar las grietas del software que usamos todos los días.

¿Cuál es tu reacción?

Sorprendido

Feliz

Indiferente

Triste

Enfadado

Aburrido

Incrédulo

¡Buen trabajo!

✏️ Ver comentarios

Sobre el Autor

Luis A.

Luis es el creador y editor jefe de Teknófilo. Se aficionó a la tecnología con un Commodore 64 e hizo sus pinitos programando gracias a los míticos libros de 🛒 'BASIC para niños' con 11 años. Con el paso de los años, la afición a los ordenadores se ha extendido a cualquier cacharrito que tenga una pantalla y CPU.

Comentarios

Deja un comentario