Claude Mythos: Aspectos destacados del informe de 244 páginas

por AI Explained

Resumen

AI Explained revisa el informe interno de 244 páginas de Anthropic sobre Claude Mythos, su modelo más poderoso que fue lanzado internamente el 24 de febrero. El modelo muestra mejoras masivas en benchmarks de programación (25% mejor que Opus 4.6 en SWEBench Pro) y puede encontrar vulnerabilidades zero-day en software de décadas como Firefox, con un experto en seguridad encontrando más bugs en semanas que en toda su carrera anterior.

IntermedioLanzamiento de ModeloBenchmarksSeguridad IAAsistentes de Código

Herramientas Discutidas

Claude Mythos

Powerful capabilities but concerning security implications and not publicly available

Desglose del Puntaje

Puntaje bruto: 87= 87/100

Verificación Automatizada

40 / 40

Testing de Prompts—

Ejecución de Código—

Validación de Links—

Verificación de Claims8

Precisión de Versiones—

Análisis de Calidad (IA)

33 / 40

Originalidad6

Especificidad7

Completitud6

Densidad de Valor7

Honestidad / Limitaciones7

Modelo: anthropic/claude-sonnet-4

Señales de Contexto

14 / 20

Frescura5

Historial del Autor2

Engagement Real7

Tests de Verificación

APROBADOVerificación de Herramientas13117ms