Claude Opus 4: el nuevo modelo de Anthropic que doblega a ChatGPT en tareas de programación

Anthropic ha presentado su nuevo caballo de batalla en el terreno de las IA, y en esta ocasión, ha apostado por especializarse en todo lo que tiene que ver con la programación. Su nombre final ha sido Claude Opus 4, y se ha orientado a tareas de razonamiento, ejecución de herramientas y análisis de documentos extensos.
La llegada de Claude Opus 4 solo tiene un punto negro con respecto a sus competidores, y es que aún mantiene su ventana de contexto en 200.000 tokens. De hecho, es el mismo número de tokens que tiene el propio Claude 3, por lo que los s se han quedado un poco tibios con este dato. Pero más allá de ello, Claude tiene mucho que ofrecernos con esta nueva actualización. De hecho, desde Anthropic, sus propios creadores, se han lanzado a la piscina diciendo que «es el mejor modelo de la compañía y también el mejor modelo para codificar de toda la industria».
Y es que, en pruebas realizadas con clientes como Rakuten, este nuevo modelo de IA fue capaz de escribir código de manera autónoma durante siete horas ininterrumpidas. De hecho, objetivamente, GPT-4.1 no puede igualarlo en estos momentos, ya que no puede ni alcanzar una hora entera de concentración. Lo mismo se aplica para los modelos de Gemini.
El líder en tareas de programación
Anthropic trae un nuevo miembro a la familia de los modelos del lenguaje, pero hay que decir que Claude Opus 4 no viene solo. También viene con Claude Sonnet 4 bajo el frazo. Y aunque ambos comparten el mismo contexto de 200.000 tokens y tienen la misma arquitectura base, sus aplicaciones y rendimiento están bastante diferenciados.
Claude Sonnet 4
Claude Sonnet 4 está diseñado más para un concepto general. Podría decirse que es la versión más eficiente y accesible. O sea, para cuestiones más cotidianas, lo que es una buena opción como asistente personal, o como redactor de texto. Pero su ligereza no es sinónimo de falta de potencia, porque ha recibido mejoras en comprensión de instrucciones y, cómo no, respuestas más naturales para los s. Tampoco le ha faltado mejoras en la integración con nuevas apps, como son Slack, Notion o Vertex AI de Google.
Claude Opus 4
Claude Opus 4 representa el buque insignia de los nuevos modelos de Anthropic. Es el modelo enfocado en la programación de alto nivel, el razonamiento completo y análisis de documentos extensos. Es más, su rendimiento ha superado en test benchmarks a GPT-4.1 y Gemini 1.5, concretamente en tareas de codificación y resolución de problemas a largo plazo. Y es que, tal y como te hemos dicho antes, Claude Opus 4 ha logrado mantener más de 6 horas de contexto estable sin ningún tipo de error en la programación. Algo que sus rivales aún ven lejano.
Si quieres utilizar cualquiera de los dos modelos, puedes hacerlo directamente desde su propia web de claude.ai, o bien, desde los servicios de Amazon Bedrock o Google Cloud. Dependiendo de lo que busques, puedes optar por Opus o Sonnet, pero si lo que quieres es una herramienta de codificación que roce lo excelente, opta por la primera.