Anthropic confirmó el desarrollo del modelo más potente, Claude Mythos; los detalles surgieron tras una filtración.
Breve sobre el evento
La empresa Anthropic confirmó oficialmente que está desarrollando un nuevo modelo de inteligencia artificial — Claude Mythos. Supera a todas las versiones anteriores en funcionalidad y, según la propia compañía, presenta “riesgos sin precedentes” para la ciberseguridad. La información surgió tras una filtración accidental de borradores que llegaron al caché público.
1. Qué ocurrió
Fecha: jueves por la tarde
En el caché público se encontró un borrador del blog de Anthropic donde se menciona a Claude Mythos como una IA que genera “riesgos sin precedentes” en ciberseguridad.
Después de ser notificada Fortune, la compañía cerró la búsqueda pública del caché y restringió el acceso a los documentos. La causa de la filtración, explica Anthropic, fue un “malentendido humano” al configurar el sistema de gestión de contenidos.
2. Alcance de la filtración
* Aproximadamente 3 000 materiales, incluidos borradores de blogs y documentos internos, llegaron al público.
* Entre los archivos filtrados:
* PDF sobre un evento cerrado para CEOs de empresas europeas en Reino Unido (con la participación de Dario Amodei).
* Documentos que describen nuevos niveles de modelos IA — Capybara y Claude Mythos.
* La estimación del volumen de la filtración fue realizada por dos expertos:
* Alexander Povels – investigador de ciberseguridad de la University of Cambridge.
* Roy Paz – investigador senior de seguridad IA en LayerX Security.
3. Qué son Capybara y Claude Mythos
Elemento | Descripción
---|---
Capybara | Nuevo nivel de modelos, más grande e inteligente que Opus (el “más potente” actual). Internamente pertenece a la misma base que Claude Mythos.
Claude Mythos | El modelo más reciente de la compañía. Ofrece resultados significativamente mejores en programación, razonamiento académico y ciberseguridad comparado con Opus 4.6.
Actualmente Anthropic vende tres niveles de modelos: Opus, Sonnet y Haiku.
4. Enfoque clave – riesgos para la ciberseguridad
* El modelo Claude Mythos se describe como un sistema que puede identificar vulnerabilidades más rápido que los métodos tradicionales de defensa.
* Según el plan de la empresa, el acceso temprano solo se dará a organizaciones dedicadas a la protección cibernética, para que puedan preparar sus sistemas ante posibles ataques impulsados por IA.
5. Comparación con competidores
Empresa | Modelo | Punto clave
---|---|---
OpenAI | GPT‑5.3‑Codex (febrero) | Primer modelo clasificado como “Preparedness” en ciberseguridad; entrenado para detectar vulnerabilidades de software.
Anthropic | Opus 4.6 (hoy) | Capaz de descubrir vulnerabilidades previamente desconocidas en bases de código.
6. Qué sigue?
* Claude Mythos está en fase final de entrenamiento y se planea su lanzamiento en acceso temprano limitado.
* La compañía subraya que el modelo aún no está listo para uso masivo debido a altos costos operativos.
Así, la filtración reveló detalles sobre el nuevo modelo de Anthropic, su potencial y los riesgos significativos para la industria de ciberseguridad. La propia empresa ya tomó medidas para limitar el acceso a los materiales filtrados y explicó la causa del incidente.
Comentarios (0)
Comparte tu opinión — por favor, sé amable y mantente en el tema.
Inicia sesión para comentar