¿Qué nos prometen los nuevos modelos IA Claude Sonnet 3.5 de Anthropic?

Mejoras en tareas de programación asistida (agentic coding) y capacidades multimodales de visión.

2 min readJun 20, 2024

Nuevo Artifact: En su versión chat, es capaz de ejecutar código en vivo.
Mejor que GPT-4 en tareas de conocimiento, razonamiento, matemáticas y programación.
Mayor velocidad de respuesta y un costo 5 veces menor que su modelo anterior.

Según la información proporcionada por Anthropic, Claude Sonnet 3.5 supera al modelo anterior Claude Opus 3 por varias razones clave:

Mejores resultados en benchmarks:

Establece nuevos récords en evaluaciones de razonamiento de nivel de posgrado (GPQA), conocimiento de nivel universitario (MMLU) y habilidades de programación (HumanEval).

Supera a Claude Opus 3 y otros modelos competidores como GPT-4 en una amplia gama de evaluaciones.

Demuestra una mejor comprensión de matices, humor e instrucciones complejas.
Es excepcional en la generación de contenido de alta calidad con un tono natural y relatable.

Mayor velocidad de inferencia (responde más rápido)

Doble de velocidad que Claude Opus 3, su predecesor.
Esta mejora en el rendimiento, combinada con un precio más asequible, lo hace ideal para tareas complejas que requieren una inferencia rápida.

Mejores capacidades de “codificación autónoma” (agentic coding):

En una evaluación interna, Claude Sonnet 3.5 resolvió el 64% de los problemas de “codificación autónoma”, superando el 38% de Claude Opus 3.
Esto implica una mejor capacidad para comprender repositorios de código, solucionar errores, agregar funcionalidades y escribir/editar código a partir de descripciones en lenguaje natural.
Maneja con facilidad las traducciones de código, lo que lo hace efectivo para actualizar aplicaciones antiguas y migrar bases de código.

Mejores capacidades de visión:

Claude Sonnet 3.5 es el modelo de visión más potente de Anthropic hasta ahora, superando a Claude Opus 3 en benchmarks estándar de visión.
Muestra mejoras significativas en tareas que requieren razonamiento visual, como interpretar gráficos y tablas.
Puede transcribir texto con precisión a partir de imágenes imperfectas, lo cual es útil en sectores como el minorista, la logística y los servicios financieros.

Claude 3.5 Sonnet de Anthropic ya está disponible en CodeGPT como asistente de código y lo puede utilizar completamente gratis!