OVHcloud apuesta por desarrollar LLM propios en Europa

OVHcloud, uno de los mayores proveedores de infraestructura cloud en Europa, ha anunciado que está dando un paso más allá de la simple oferta de servidores y datos: se adentrará en la creación de modelos de lenguaje grande (LLM) desde cero. La iniciativa nace en un contexto donde gobiernos y empresas del continente buscan reducir la dependencia de los sistemas de inteligencia artificial desarrollados en Estados Unidos y China. El director ejecutivo, Octave Klaba, explicó a Reuters que la compañía quiere formar una familia de modelos propios y, una vez que alcancen los objetivos de desempeño, ponerlos a disposición de la comunidad como código abierto.

Para entrenar su primer LLM, OVOVcloud no utilizó sus propios centros de datos, sino que recurrió al supercomputador Jupiter, parte del programa europeo EuroHPC y ubicado en Alemania. Jupiter es el primer sistema exaescala de la región y, según la empresa, es actualmente el más rápido de Europa. No se han publicado métricas de rendimiento ni detalles sobre el conjunto de datos empleado, lo que deja abierta la cuestión de la calidad y la amplitud del corpus de entrenamiento.

La reducción del costo de entrenamiento es uno de los argumentos centrales del anuncio. Klaba señaló que, gracias a avances en hardware de chips, técnicas de entrenamiento más eficientes y el uso de datos sintéticos, un proyecto que antes requería alrededor de 1.150 millones de dólares ahora puede ejecutarse con menos de 230 millones de dólares (aproximadamente 200 millones de euros). Este número, sin embargo, corresponde principalmente a la fase de pre‑entrenamiento. Expertos de la industria recuerdan que el coste total de un modelo de IA incluye también afinación fina, post‑entrenamiento, almacenamiento, seguridad, distribución y soporte a clientes, gastos que pueden convertir al modelo en un activo que pierde valor si no se actualiza con datos recientes.

Neil Shah, vicepresidente de investigación en Counterpoint Research, recalca que la cifra anunciada cubre solo la inversión inicial. “Una vez que el modelo está entrenado, se vuelve un activo que se deprecia si no se mantiene con nuevos datos”, señaló. Para que OVHcloud sea competitivo frente a gigantes como Google, OpenAI o Anthropic, necesitará no solo una infraestructura de entrenamiento eficaz, sino también una cadena de suministro de datos, pipelines de inferencia optimizados y un ecosistema de herramientas que faciliten la integración por parte de las empresas.

El aspecto de soberanía digital también está presente en la discusión. Aunque el entrenamiento se realizó en la infraestructura pública europea, Jupiter sigue dependiendo de procesadores fabricados en EE. UU., lo que muestra los límites de una independencia total. Sanchit Vir Gogia, analista senior de Greyhound Research, advierte que la utilización de recursos externos debilita la narrativa de “IA europea totalmente soberana”. Además, la ausencia de benchmarks públicos dificulta que los directores de sistemas (CIO) evalúen la robustez y la seguridad de los modelos antes de adoptarlos en producción.

Desde la perspectiva de los usuarios empresariales, la propuesta de OVHcloud plantea preguntas clave: ¿el modelo será fácil de auditar? ¿existirá una política clara para gestionar actualizaciones y retirar versiones obsoletas sin interrumpir los servicios? La respuesta a estos interrogantes determinará el nivel de confianza que las organizaciones estarán dispuestas a depositar en una solución desarrollada localmente.

A pesar de los retos, algunos analistas consideran que el presupuesto anunciado le brinda a OVHcloud una base razonable para crear un LLM competitivo. Charlie Dai, principal analyst en Forrester, indica que la reducción de costos de entrada permite a nuevos actores producir modelos de alta calidad, siempre que mantengan la eficiencia en la fase de inferencia y construyan un ecosistema sólido alrededor de ellos.

En última instancia, el proyecto de OVHcloud constituye un experimento tanto tecnológico como político. Si logra escalar y abrir sus modelos bajo una licencia de código abierto, podría ofrecer a las empresas europeas una alternativa más cercana a sus requerimientos de gobernanza de datos y continuidad de acceso. Por otro lado, si los retos de infraestructura, costos operativos y adopción no se superan, el mercado podría seguir dominado por los proveedores tradicionales, manteniendo la dependencia que los legisladores buscan reducir.

Para los ejecutivos latinoamericanos que evalúan sus opciones de IA, la iniciativa muestra que la creación de modelos propios ya no está reservada a los megaconglomerados. Un gasto inicial de alrededor de 200 millones de euros puede considerarse un punto de partida viable, siempre que exista una estrategia clara para el mantenimiento continuo, la seguridad y la integración con los procesos de negocio. La lección clave es que la inversión tecnológica debe acompañarse de una visión a largo plazo que incluya no solo el entrenamiento, sino todo el ciclo de vida del modelo.

Shalem Pérez

También te puede interesar

Eco‑digitalismo: la ilusión verde que la IA está vendiendo

Microsoft controla la IA generativa en China: ¿beneficio o riesgo para la soberanía?

Soberanía digital europea: por qué OVHcloud debe liderar la IA local