¿Qué nos prometen los nuevos modelos IA Claude Sonnet 3.5 de Anthropic?
Mejoras en tareas de programación asistida (agentic coding) y capacidades multimodales de visión.
2 min readJun 20, 2024
- Nuevo Artifact: En su versión chat, es capaz de ejecutar código en vivo.
- Mejor que GPT-4 en tareas de conocimiento, razonamiento, matemáticas y programación.
- Mayor velocidad de respuesta y un costo 5 veces menor que su modelo anterior.
Según la información proporcionada por Anthropic, Claude Sonnet 3.5 supera al modelo anterior Claude Opus 3 por varias razones clave:
Mejores resultados en benchmarks:
Establece nuevos récords en evaluaciones de razonamiento de nivel de posgrado (GPQA), conocimiento de nivel universitario (MMLU) y habilidades de programación (HumanEval).
Supera a Claude Opus 3 y otros modelos competidores como GPT-4 en una amplia gama de evaluaciones.
- Demuestra una mejor comprensión de matices, humor e instrucciones complejas.
- Es excepcional en la generación de contenido de alta calidad con un tono natural y relatable.
Mayor velocidad de inferencia (responde más rápido)
- Doble de velocidad que Claude Opus 3, su predecesor.
- Esta mejora en el rendimiento, combinada con un precio más asequible, lo hace ideal para tareas complejas que requieren una inferencia rápida.
Mejores capacidades de “codificación autónoma” (agentic coding):
- En una evaluación interna, Claude Sonnet 3.5 resolvió el 64% de los problemas de “codificación autónoma”, superando el 38% de Claude Opus 3.
- Esto implica una mejor capacidad para comprender repositorios de código, solucionar errores, agregar funcionalidades y escribir/editar código a partir de descripciones en lenguaje natural.
- Maneja con facilidad las traducciones de código, lo que lo hace efectivo para actualizar aplicaciones antiguas y migrar bases de código.
Mejores capacidades de visión:
- Claude Sonnet 3.5 es el modelo de visión más potente de Anthropic hasta ahora, superando a Claude Opus 3 en benchmarks estándar de visión.
- Muestra mejoras significativas en tareas que requieren razonamiento visual, como interpretar gráficos y tablas.
- Puede transcribir texto con precisión a partir de imágenes imperfectas, lo cual es útil en sectores como el minorista, la logística y los servicios financieros.
Claude 3.5 Sonnet de Anthropic ya está disponible en CodeGPT como asistente de código y lo puede utilizar completamente gratis!