fbpx

DeepSeek R1: cómo el modelo de IA de China sacudió al mundo y cambió las reglas del juego

10 veces más barato, 10 veces más eficiente - DeepSeek R1

DeepSeek R1

DeepSeek R1, un nuevo modelo de inteligencia artificial de código abierto de China, se ha convertido en una sensación mundial. Con un enfoque innovador que utiliza recursos mínimos, el modelo construido por menos de 6 millones de dólares ha logrado una calidad comparable a las mejores soluciones estadounidenses. ¿Qué significa esto para el futuro de la inteligencia artificial y cómo responderán gigantes como OpenAI, Nvidia y Google?

El mundo de la inteligencia artificial ha vivido un terremoto. Investigación de China el equipo de DeepSeek creó un modelo de IA de código abierto que establece nuevos estándares en la industria en solo dos meses y con un presupuesto de 5,6 millones de dólares. El modelo DeepSeek R1 es más barato, más eficiente y comparable a modelos líderes como GPT-4, Anthropic Claude y Meta Llama.

Pero lo impactante no es sólo la rapidez y el bajo costo de desarrollo del modelo: es sorprendente que se haya hecho con hardware que las sanciones estadounidenses buscan desactivar. DeepSeek R1 es la prueba viviente de que la innovación no requiere tecnología costosa, sino estrategia e ingenio inteligentes.

Nasdaq y Nvidia: el efecto dominó

El índice tecnológico Nasdaq, en el que Nvidia es una de las estrellas más importantes, también se vio afectado. A medida que se difundió la noticia del avance de DeepSeek, el índice perdió terreno en medio de la incertidumbre sobre el futuro del hardware de IA. Además, los inversores empezaron a cuestionar la estrategia anterior de inversiones masivas en infraestructuras costosas.

¿Por qué DeepSeek R1?

DeepSeek R1 es un modelo de inteligencia artificial de código abierto diseñado para una amplia disponibilidad y bajo costo. El modelo utiliza una "Mezcla de Expertos", un método que permite la optimización del hardware para lograr un alto rendimiento incluso con recursos limitados.

  • Precio de uso: Solo 10 centavos por millón de tokens, que es 1/30 del costo de GPT-4.
  • Hardware: Las GPU Nvidia H800, que son menos potentes que las H100 estadounidenses, pero se utilizaron de manera increíblemente efectiva.
  • Tiempo de desarrollo: Sólo 60 días, lo cual es impresionante en comparación con los largos procesos de otras empresas.

DeepSeek es una prueba de que la innovación centrada en la optimización puede competir con un desarrollo costoso y de alto rendimiento.

Comparación con los gigantes americanos

Gigantes como OpenAI, Google y Anthropic están invirtiendo miles de millones de dólares en el desarrollo de la inteligencia artificial. Por ejemplo, OpenAI ha gastado más de 5 mil millones de dólares en 2024, y Microsoft ha comprometido 13 mil millones de dólares solo para respaldar OpenAI.

DeepSeek logró casi la misma calidad con sus 5,6 millones de dólares. Aquí hay una comparación:

  1. GPT-4: Más potente en tareas complejas, pero extremadamente caro de utilizar.
  2. Metallama: Una alternativa de código abierto, pero aún más intensiva en recursos que DeepSeek.
  3. Búsqueda profunda R1: Más barato, más rápido, más sencillo y de código abierto.

¿Cuál es el secreto del éxito de DeepSeek?

DeepSeek R1 es el resultado de varias innovaciones clave:

  • Optimización de hardware: Al utilizar GPU menos potentes, lograron estabilidad al reducir la cantidad de cálculos y una gestión precisa de la memoria.
  • Compresión de modelos: En lugar de construir modelos masivos, utilizaron técnicas como la destilación de conocimientos, que permite crear un modelo más pequeño pero igualmente poderoso.
  • Uso inteligente de los datos: Utilizaron datos disponibles públicamente y arquitecturas existentes para reducir el tiempo y los costos de desarrollo.

El enfoque de DeepSeek no se basa en la innovación "desde cero", sino en la actualización de las soluciones existentes.

¿Qué significa esto para el futuro de la IA?

  1. democratizando la IA: Los modelos de código abierto como DeepSeek R1 brindan acceso a tecnologías de vanguardia para pequeñas empresas y desarrolladores de todo el mundo.
  2. El fin del monopolio de las grandes empresas: OpenAI y Google tendrán que repensar su estrategia a medida que alternativas más baratas amenacen su dominio.
  3. Implicaciones geopolíticas: China está demostrando que puede innovar y competir en el mercado global a pesar de sus limitaciones, lo que está impulsando la competitividad y al mismo tiempo plantea dudas sobre la seguridad y el control de la IA.

Declaración de Sam Altman, director ejecutivo de OpenAI:

“Es relativamente fácil copiar algo que funciona. Es extremadamente difícil crear algo nuevo, arriesgado y difícil cuando no sabes si funcionará".

La opinión de Altman sugiere que DeepSeek puede no ser un pionero sino un seguidor pragmático. Pero la pregunta es, ¿realmente importa? Si los modelos de código abierto como DeepSeek R1 pueden lograr la misma calidad a una fracción del costo, entonces el futuro de la inteligencia artificial será cada vez más descentralizado.


Conclusión: IA para todos

DeepSeek R1 no es sólo tecnología: es un símbolo de una nueva era en la que la innovación traspasa los límites con menos recursos y mayor accesibilidad. Para los desarrolladores, las empresas y los países, esto significa que el futuro de la inteligencia artificial ya no está reservado a presupuestos de miles de millones de dólares.

Con este modelo, China no sólo está alcanzando a Occidente, sino que está estableciendo nuevas reglas del juego. Y aunque el futuro está abierto, una cosa es segura: la IA ahora es accesible para todos.

 

Más información

chat.deepseek.com

contigo desde 2004

Del año 2004 investigamos tendencias urbanas e informamos a nuestra comunidad de seguidores diariamente sobre lo último en estilo de vida, viajes, estilo y productos que inspiran con pasión. A partir de 2023, ofrecemos contenido en los principales idiomas del mundo.