Modelo de lenguaje pequeño Phi-4 de código abierto de Microsoft, disponible para descargar en Hugging Face
microsoft abrió su modelo de lenguaje pequeño Phi-4 el miércoles. El último modelo de inteligencia artificial (IA) de la serie Phi se lanzó el mes pasado; sin embargo, en ese momento solo estaba disponible a través de Azure AI Foundry de la compañía. En ese momento, el gigante tecnológico con sede en Redmond dijo que pronto haría que el código fuente del modelo de IA estuviera disponible en el dominio público. Ahora, las personas interesadas pueden acceder al modelo de IA centrado en el razonamiento a través de Hugging Face. Microsoft también permite que el modelo se utilice para casos de uso tanto académicos como comerciales.
Modelo de IA Phi-4 de código abierto de Microsoft
Shital Shah, miembro del personal técnico de Microsoft AI, tomó a X (anteriormente conocido como Twitter) para anunciar la disponibilidad de los pesos del modelo Phi-4 AI en Hugging Face. El modelo de IA está disponible con la licencia MIT para uso académico y comercial. Las personas interesadas pueden acceder al listado de modelos. aquí.
Lanzado ocho meses después del lanzamiento del modelo de IA Phi-3, se dice que el SLM ofrece mejoras significativas en la resolución de consultas complejas basadas en el razonamiento en áreas como las matemáticas. El Phi-4 tiene una ventana de contexto de 16.000 tokens y fue entrenado con un conjunto de datos de 9,8 billones de tokens.
Citando la fuente de los datos de capacitación, la lista de Hugging Face destaca que el conjunto de datos comprende códigos y datos educativos de alta calidad disponibles públicamente, datos sintéticos en una amplia gama de temas, libros académicos adquiridos y conjuntos de datos de preguntas y respuestas, así como datos supervisados en formato de chat.
En particular, es un modelo de sólo texto, lo que significa que sólo acepta texto como entrada y salida. El modelo de IA viene con 14 mil millones de parámetros. Microsoft afirma que el modelo de IA se construyó sobre una arquitectura Transformer densa solo decodificadora.
En el momento del lanzamiento, Microsoft también compartió puntuaciones de referencia del modelo de IA. Basándose en ellos, la compañía afirmó que la última versión del Phi SLM supera al modelo Gemini 1.5 Pro en el punto de referencia de problemas de competencia matemática.
También se puede acceder al modelo Phi-4 AI a través de Azure AI Foundry de Microsoft. La plataforma también ofrece ayudar a los desarrolladores y empresas a gestionar los riesgos de la IA. También viene con funciones como escudos de avisos, detección de conexión a tierra y filtros de contenido. Estas capacidades de seguridad también se pueden exportar a una aplicación utilizando la interfaz de programación de aplicaciones (API) de la empresa.
Vea lo último del Consumer Electronics Show en Gadgets 360, en nuestro CES 2025 centro.