Noticias

DeepSeek-R1 de código abierto utiliza aprendizaje por refuerzo puro para igualar OpenAI o1, con un costo un 95 % menor

Published

1 año ago

enero 20, 2025

DeepSeek-R1: La nueva revolución en inteligencia artificial

Una startup china de IA, DeepSeek, ha lanzado un nuevo LLM de razonamiento abierto llamado DeepSeek-R1. Este nuevo modelo desafía a los principales proveedores de inteligencia artificial con tecnologías de código abierto, igualando el rendimiento de o1 de OpenAI en tareas de matemáticas, codificación y razonamiento, pero a un costo mucho más asequible.

¿Qué aporta DeepSeek-R1?

DeepSeek-R1 utiliza una combinación de RL y ajuste fino supervisado para manejar tareas de razonamiento complejas y mejorar su rendimiento. Cuando se probó, obtuvo excelentes resultados en pruebas de matemáticas y programación, demostrando su capacidad para igualar e incluso superar a modelos comerciales cerrados en diversas áreas.

El canal de formación

El proceso de entrenamiento de DeepSeek-R1 es un hito importante en el ámbito de la IA, ya que todo el trabajo es de código abierto. El modelo se desarrolló como una versión mejorada de DeepSeek-R1-Zero, utilizando un enfoque de varias etapas que combina aprendizaje supervisado y aprendizaje reforzado para crear un modelo más avanzado.

Mucho más asequible que o1

Además de su rendimiento mejorado, DeepSeek-R1 es mucho más asequible que o1 de OpenAI. Mientras que o1 tiene un costo significativo, DeepSeek Reasoner ofrece tarifas mucho más accesibles, lo que lo convierte en una opción atractiva para aquellos que buscan tecnología de vanguardia a precios razonables.

Para obtener más información sobre DeepSeek-R1 y acceder a sus recursos, puedes visitar el sitio web de Hugging Face. Sumérgete en la revolución de la inteligencia artificial con DeepSeek-R1 y descubre un mundo de posibilidades.

Diario Artificial – Noticias de Inteligencia Artificial

Noticias

DeepSeek-R1 de código abierto utiliza aprendizaje por refuerzo puro para igualar OpenAI o1, con un costo un 95 % menor

¿Qué aporta DeepSeek-R1?

El canal de formación

Mucho más asequible que o1

Leave a Reply

Leave a Reply

Tendencias

¿Qué aporta DeepSeek-R1?

El canal de formación

Mucho más asequible que o1

Leave a Reply Cancelar respuesta

Leave a Reply

Tendencias

Leave a Reply