DeepSeek: Una IA china que desafía a OpenAI en precio y eficiencia

La IA china DeepSeek compite con OpenAI ofreciendo modelos de lenguaje similares a un precio mucho menor, gracias a una estrategia de desarrollo más eficiente.

Por Redacción Kenja7 de marzo de 2025, 2:13 p. m.

¿escuchaste hablar de DeepSeek? Es una inteligencia artificial china que está dando que hablar en el mundo tech. No solo por lo que puede hacer, sino porque parece que la desarrollaron con dos mangos y un puñado de centavos, mucho menos que lo que gastan gigantes como OpenAI. ¿Cómo lo lograron? Acá te contamos.

El desarrollo de hardware en China

Lo primero que llama la atención es cómo DeepSeek pudo surgir en China a pesar de las dificultades para acceder a hardware de vanguardia. La guerra comercial con Estados Unidos limita el acceso a las placas de video más potentes de NVIDIA, esenciales para el entrenamiento de IA. Sin embargo, DeepSeek afirma haber utilizado chips H800 de NVIDIA, pero con una inversión significativamente menor a la de sus competidores.

El bajo costo de entrenamiento de la IA

Mientras que OpenAI invirtió 100 millones de dólares en el entrenamiento de GPT-4, DeepSeek declara haber entrenado su IA con solo 5,6 millones de dólares y 2.788 millones de horas de entrenamiento. Esta drástica diferencia de costos plantea interrogantes sobre la eficiencia del modelo chino.

Comparativa de costos de mantenimiento

La diferencia en costos no se limita al entrenamiento. Mantener ChatGPT en funcionamiento le cuesta a OpenAI aproximadamente 700.000 dólares por día. DeepSeek, en cambio, reporta un gasto diario de tan solo 87.000 dólares. Esta disparidad sugiere una mayor eficiencia en la infraestructura y el consumo energético.

Los modelos de DeepSeek: V3 y R1

DeepSeek cuenta con dos modelos principales: V3, un chatbot conversacional similar a GPT-4, diseñado para la creación de contenido; y R1, un modelo de razonamiento comparable a O1 de OpenAI, enfocado en la resolución de problemas y la lógica. Según Reuters, DeepSeek podría estar generando una importante ganancia teórica, aunque la empresa admite que los ingresos reales son menores.

La estrategia de DeepSeek: "Reinforcement Learning" y chips Huawei

La eficiencia de DeepSeek parece radicar en la combinación del \"reinforcement learning\" con el uso de chips Ascend 910B de Huawei. Estos chips, más económicos y eficientes que los de NVIDIA, se utilizan para la \"inferencia\", es decir, la aplicación práctica del conocimiento adquirido por la IA durante su entrenamiento. Esta estrategia podría marcar un cambio de paradigma en el desarrollo de IA, demostrando que no siempre es necesario el hardware más costoso.

El futuro de la IA y el impacto de DeepSeek

DeepSeek genera debate en la industria. Si bien existen dudas sobre las cifras reportadas, su enfoque de bajo costo y alta eficiencia podría inspirar a otras empresas a explorar alternativas más accesibles para el desarrollo de IA. Con el impulso de China en el campo de la inteligencia artificial, DeepSeek se posiciona como un potencial agente de cambio hacia una IA más democrática.