¿Qué nos prometen los nuevos modelos IA Claude Sonnet 3.5 de Anthropic?

Mejoras en tareas de programación asistida (agentic coding) y capacidades multimodales de visión.

Gustavo Espíndola
2 min readJun 20, 2024
  • Nuevo Artifact: En su versión chat, es capaz de ejecutar código en vivo.
  • Mejor que GPT-4 en tareas de conocimiento, razonamiento, matemáticas y programación.
  • Mayor velocidad de respuesta y un costo 5 veces menor que su modelo anterior.
Artifact Claude Chat by Anthropic

Según la información proporcionada por Anthropic, Claude Sonnet 3.5 supera al modelo anterior Claude Opus 3 por varias razones clave:

Mejores resultados en benchmarks:

Establece nuevos récords en evaluaciones de razonamiento de nivel de posgrado (GPQA), conocimiento de nivel universitario (MMLU) y habilidades de programación (HumanEval).

Supera a Claude Opus 3 y otros modelos competidores como GPT-4 en una amplia gama de evaluaciones.

  • Demuestra una mejor comprensión de matices, humor e instrucciones complejas.
  • Es excepcional en la generación de contenido de alta calidad con un tono natural y relatable.

Mayor velocidad de inferencia (responde más rápido)

  • Doble de velocidad que Claude Opus 3, su predecesor.
  • Esta mejora en el rendimiento, combinada con un precio más asequible, lo hace ideal para tareas complejas que requieren una inferencia rápida.

Mejores capacidades de “codificación autónoma” (agentic coding):

  • En una evaluación interna, Claude Sonnet 3.5 resolvió el 64% de los problemas de “codificación autónoma”, superando el 38% de Claude Opus 3.
  • Esto implica una mejor capacidad para comprender repositorios de código, solucionar errores, agregar funcionalidades y escribir/editar código a partir de descripciones en lenguaje natural.
  • Maneja con facilidad las traducciones de código, lo que lo hace efectivo para actualizar aplicaciones antiguas y migrar bases de código.

Mejores capacidades de visión:

  • Claude Sonnet 3.5 es el modelo de visión más potente de Anthropic hasta ahora, superando a Claude Opus 3 en benchmarks estándar de visión.
  • Muestra mejoras significativas en tareas que requieren razonamiento visual, como interpretar gráficos y tablas.
  • Puede transcribir texto con precisión a partir de imágenes imperfectas, lo cual es útil en sectores como el minorista, la logística y los servicios financieros.

Claude 3.5 Sonnet de Anthropic ya está disponible en CodeGPT como asistente de código y lo puede utilizar completamente gratis!

--

--

Gustavo Espíndola

Maker & Senior Product Designer — Co-founder of CodeGPT by Judini AI