Noticias
DeepSeek-R1 de código abierto utiliza aprendizaje por refuerzo puro para igualar OpenAI o1, con un costo un 95 % menor
DeepSeek-R1: La nueva revolución en inteligencia artificial
Una startup china de IA, DeepSeek, ha lanzado un nuevo LLM de razonamiento abierto llamado DeepSeek-R1. Este nuevo modelo desafía a los principales proveedores de inteligencia artificial con tecnologías de código abierto, igualando el rendimiento de o1 de OpenAI en tareas de matemáticas, codificación y razonamiento, pero a un costo mucho más asequible.
¿Qué aporta DeepSeek-R1?
DeepSeek-R1 utiliza una combinación de RL y ajuste fino supervisado para manejar tareas de razonamiento complejas y mejorar su rendimiento. Cuando se probó, obtuvo excelentes resultados en pruebas de matemáticas y programación, demostrando su capacidad para igualar e incluso superar a modelos comerciales cerrados en diversas áreas.
El canal de formación
El proceso de entrenamiento de DeepSeek-R1 es un hito importante en el ámbito de la IA, ya que todo el trabajo es de código abierto. El modelo se desarrolló como una versión mejorada de DeepSeek-R1-Zero, utilizando un enfoque de varias etapas que combina aprendizaje supervisado y aprendizaje reforzado para crear un modelo más avanzado.
Mucho más asequible que o1
Además de su rendimiento mejorado, DeepSeek-R1 es mucho más asequible que o1 de OpenAI. Mientras que o1 tiene un costo significativo, DeepSeek Reasoner ofrece tarifas mucho más accesibles, lo que lo convierte en una opción atractiva para aquellos que buscan tecnología de vanguardia a precios razonables.
Para obtener más información sobre DeepSeek-R1 y acceder a sus recursos, puedes visitar el sitio web de Hugging Face. Sumérgete en la revolución de la inteligencia artificial con DeepSeek-R1 y descubre un mundo de posibilidades.
