Noticias

Microsoft presenta Phi-3

Una familia de modelos abiertos SLM de IA

[29/04/2024] Microsoft anunció Phi-3, una familia de modelos abiertos de IA. Según lo señalado en el comunicado de prensa, los modelos Phi-3 son los modelos de lenguaje pequeño (SLM, por sus siglas en inglés) más capaces y rentables disponibles, superando a los modelos del mismo tamaño y del siguiente tamaño en una variedad de puntos de referencia de lenguaje, razonamiento, codificación y matemáticas. Esta versión amplía la selección de modelos de alta calidad para los clientes, ofreciendo opciones más prácticas a medida que componen y crean aplicaciones de IA generativa.

"A partir de hoy, Phi-3-mini, un modelo de lenguaje 3.8B, está disponible en Microsoft Azure AI Studio, Hugging Face y Ollama. Phi-3-mini está disponible en dos variantes de longitud de contexto: tokens 4K y 128K. Es el primer modelo de su clase que admite una ventana de contexto de hasta 128K tokens, con poco impacto en la calidad, sostuvo Misha Bilenko, vicepresidente corporativo de Microsoft GenAI., en una entrada de blog

La ejecutiva anotó que está ajustado a las instrucciones, lo que significa que está entrenado para seguir diferentes tipos de instrucciones que reflejan cómo las personas se comunican normalmente. Esto garantiza que el modelo esté listo para usar desde el primer momento.

"Está disponible en Azure AI para aprovechar la cadena de herramientas, y está disponible en Ollama para que los desarrolladores lo ejecuten localmente en sus portátiles. Se ha optimizado para ONNX Runtime con soporte para Windows DirectML junto con soporte multiplataforma en la unidad de procesamiento de gráficos (GPU), CPU e incluso hardware móvil. También está disponible como un microservicio NVIDIA NIM con una interfaz API estándar que se puede implementar en cualquier lugar. Y ha sido optimizado para las GPU NVIDIA, indicó Bilenko.

En las próximas semanas, agregó la ejecutiva, se agregarán modelos adicionales a la familia Phi-3 para ofrecer a los clientes aún más flexibilidad en la curva de calidad-costo. Phi-3-small (7B) y Phi-3-medium (14B) estarán disponibles en breve en el catálogo de modelos de Azure AI.

Según Bilenko, los modelos Phi-3 superan significativamente a los modelos de lenguaje del mismo tamaño y de tamaños más grandes en puntos de referencia clave. "El Phi-3-mini lo hace mejor que los modelos que duplican su tamaño, y el Phi-3-small y el Phi-3-medium superan a los modelos mucho más grandes, incluido el GPT-3.5T.

Diseño de modelo que prioriza la seguridad

La ejecutiva añadió que los modelos Phi-3 se desarrollaron de acuerdo con el Estándar de IA responsable de Microsoft, que es un conjunto de requisitos para toda la empresa basado en los siguientes seis principios: responsabilidad, transparencia, equidad, confiabilidad y seguridad, privacidad e inclusión. Los modelos Phi-3 se sometieron a rigurosas mediciones y evaluaciones de seguridad, red-teaming, revisión de uso confidencial y cumplimiento de las directrices de seguridad para ayudar a garantizar que estos modelos se desarrollen, prueben e implementen de manera responsable en consonancia con los estándares y procedimientos recomendados de Microsoft.

"Sobre la base de nuestro trabajo previo con modelos Phi ("Los libros de texto son todo lo que necesitas"), los modelos Phi-3 también se entrenan utilizando datos de alta calidad. Se mejoraron aún más con una amplia seguridad posterior a la capacitación, incluido el aprendizaje por refuerzo de la retroalimentación humana (RLHF), pruebas y evaluaciones automatizadas en docenas de categorías de daños y equipos rojos manuales. Nuestro enfoque de la capacitación y las evaluaciones de seguridad se detalla en nuestro documento técnico, y describimos los usos recomendados y las limitaciones en las tarjetas modelo, finalizó Bilenko.

Llegamos a ustedes gracias a:


BrandPosts Qué es BrandPost

Más »
×
Los artículos publicados en esta sección -BrandPosts- son escritos y editados por los proveedores o miembros de la comunidad TI. BrandPosts crea una oportunidad para que un patrocinador proporcione información y comentarios desde su punto de vista, directamente a la audiencia de CTO Perú. El equipo editorial de CTO Perú no participa en la redacción o edición de estos BrandPosts.

Primer contacto

Más »

Casos de éxito

Más »