Multimillonario respaldado por SoftBank para invertir $ 230 millones en la startup india de IA Krutrim

Multimillonario respaldado por SoftBank para invertir $ 230 millones en la startup india de IA Krutrim

El fundador de OLA, Bhavish Aggarwal, está invirtiendo $ 230 millones en una startup de IA que fundó mientras el país presiona para establecerse en un campo dominado por las empresas estadounidenses y chinas.

Aggarwal está financiando la inversión en Krutrim en gran medida a través de su oficina familiar, dijo una fuente familiarizada con el asunto TechCrunch. En Una publicación en x El martes, Aggarwal dijo que Krutrim busca atraer una inversión de $ 1.15 mil millones para el próximo año. Buscará recaudar el resto de la capital de inversores externos, dijo la fuente.

El anuncio de financiación coincide con la startup de unicornio Krutrim, haciendo sus modelos de IA de código abierto y presentación de planes para construir lo que afirma que será la supercomputadora más grande de la India en asociación con Nvidia.

El laboratorio Lanzó Krutrim-2, un modelo de idioma de parámetros de 12 mil millones que ha mostrado un fuerte rendimiento en el procesamiento de idiomas indios. En las pruebas de análisis de sentimientos Krutrim martes compartidoobtuvo 0.95 en comparación con 0.70 para modelos competidores, al tiempo que logró una tasa de éxito del 80% en las tareas de generación de código.

El laboratorio ha abierto varios modelos especializados, incluidos sistemas para procesar imágenes, traducción del habla y búsqueda de texto, todos optimizados para idiomas indios.

“Todavía no estamos cerca de los puntos de referencia globales, pero hemos hecho un buen progreso en un año”, escribió Aggarwal, cuyas otras empresas han sido respaldadas por SoftBank, en X. “Al abordar nuestros modelos, esperamos que toda la comunidad de IA india colabore para crear un ecosistema de IA indio de clase mundial “.

La iniciativa se produce cuando India busca establecerse en un panorama de inteligencia artificial dominado por las empresas estadounidenses y chinas. El reciente Lanzamiento del modelo de “razonamiento” R1 de Deepseekconstruido en un presupuesto supuestamente modesto, ha enviado ondas de choque a través de la industria tecnológica.

India la semana pasada elogió el progreso de Deepseek Y dijo que el país organizará los grandes modelos de idiomas del laboratorio de IA chino en servidores nacionales. Brazo de la nube de Krutrim Comenzó a ofrecer a Deepseek en los servidores indios la semana pasada.

Krutrim también ha desarrollado su propio marco de evaluación, Bharatbenchpara evaluar la competencia de los modelos de IA en los idiomas indios, abordando una brecha en los puntos de referencia existentes que se centran principalmente en inglés y chino.

El enfoque técnico del laboratorio incluye el uso de una ventana de contexto de 128,000 token, lo que permite que sus sistemas manejen textos más largos y conversaciones más complejas. Las métricas de rendimiento publicadas por la startup mostraron KruRim-2 logrando puntajes altos en la corrección de gramática (0.98) y conversaciones múltiples (0.91).

La inversión sigue al lanzamiento de KruRim-1 de enero, un sistema de parámetros de 7 mil millones que sirvió como el primer modelo de idioma grande de la India. El despliegue de supercomputador con NVIDIA está programado para funcionar en marzo, con una expansión planeada durante todo el año.

fuente