Anthropic lanzó su nuevo modelo de IA, Claude Sonnet 4.5, junto con varias actualizaciones en sus productos. La empresa dijo que el modelo muestra mejoras en codificación, razonamiento y matemáticas, y puede manejar tareas más largas y complejas que sus versiones anteriores. “Claude Sonnet 4.5 es el mejor modelo de codificación del mundo. Es el modelo más fuerte para crear agentes complejos. Es el mejor modelo para usar computadoras. Y muestra avances importantes en razonamiento y matemáticas”, afirmó la compañía en una publicación de blog.
Características de Claude Sonnet 4.5 de Anthropic
La actualización trae varios cambios a Claude Code, incluyendo puntos de control que permiten a los usuarios guardar su trabajo y volver a estados anteriores al instante. Anthropic renovó la interfaz del terminal y lanzó una extensión nativa para Visual Studio Code. La API de Claude ahora soporta edición de contexto y una nueva herramienta de memoria diseñada para manejar tareas más largas y agentes más complejos.
En las aplicaciones de Claude, los usuarios ahora pueden ejecutar código y crear archivos como hojas de cálculo, presentaciones y documentos directamente dentro de las conversaciones. La extensión de Claude para Chrome también se amplió a los usuarios de Max que se unieron a una lista de espera el mes pasado.
Anthropic está introduciendo el Claude Agent SDK, que da a los desarrolladores acceso a la misma infraestructura que la empresa usa para construir Claude Code. El SDK está pensado para crear agentes de IA personalizados para una gran variedad de tareas.
Claude Sonnet 4.5 ha sido lanzado bajo el marco de Seguridad de IA Nivel 3 de Anthropic, que aplica protecciones a los modelos avanzados. Estas incluyen clasificadores diseñados para detectar y bloquear usos potencialmente peligrosos, especialmente en áreas relacionadas con riesgos químicos, biológicos, radiológicos y nucleares. Anthropic dijo que la tasa de falsos positivos se ha reducido en comparación con modelos anteriores.
En pruebas de rendimiento, Claude Sonnet 4.5 lideró a otros modelos en SWE-bench Verified, que evalúa habilidades reales de codificación de software, y alcanzó un 61,4% en OSWorld, una prueba para tareas de uso de computadoras. El modelo también mostró avances en razonamiento y conocimiento específico en finanzas, derecho, medicina y STEM.
Disponibilidad de Claude Sonnet 4.5
Claude Sonnet 4.5 ya está disponible en las aplicaciones de Claude, la API, Claude Code y la plataforma para desarrolladores, al mismo precio que Claude Sonnet 4. Junto con el lanzamiento, Anthropic presentó una vista previa de investigación temporal llamada “Imagine with Claude,” que permite al modelo generar software en tiempo real sin código preescrito. La vista previa está disponible para suscriptores Max durante cinco días.