Noticias

IBM presenta Granite 3.0

Modelos de IA de alto rendimiento diseñados para empresas

[22/10/2024] IBM anunció el lanzamiento de su familia más avanzada de modelos de inteligencia artificial (IA) hasta la fecha, la Granite 3.0. Según lo señalado en el comunicado de prensa, los modelos de lenguaje Granite de tercera generación de IBM pueden superar o igualar modelos de tamaño similar de proveedores de modelos líderes en muchos benchmarks académicos y de la industria, mostrando un gran rendimiento, transparencia y seguridad.

"De acuerdo con el compromiso de la compañía con la IA de código abierto, los modelos Granite se lanzan bajo la licencia permisiva Apache 2.0, lo que los hace únicos en la combinación de rendimiento, flexibilidad y autonomía que brindan a los clientes empresariales y a la comunidad en general, comentó Cindy Sandoval, líder de IA y Software para IBM Peru, Ecuador y Bolivia.

La familia Granite 3.0 de IBM incluye:

  • General Purpose/Language: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • Guardrails & Safety: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • Mixture-of-Experts: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

La ejecutiva comentó que los nuevos modelos de lenguaje Granite 3.0 8B y 2B están diseñados como modelos de "caballo de batalla para la IA empresarial, que ofrecen un sólido rendimiento para tareas como la Retrieval Augmented Geneneration (RAG), clasificación, resúmenes, extracción de entidades y uso de herramientas. "Estos modelos compactos y versátiles están diseñados para ajustarse a los datos empresariales e integrarse sin problemas en diversos entornos empresariales o flujos de trabajo.

Si bien muchos modelos de lenguaje grandes (LLM) son entrenados con datos que están disponibles públicamente, la gran mayoría de los datos empresariales aun no son explotados, anotó Sandoval. "Al combinar un modelo Granite pequeño con datos empresariales, especialmente utilizando la técnica de alineación InstructLab, introducida por IBM y Red Hat en mayo, IBM cree que las empresas pueden lograr un rendimiento 'específico para tareas' que compite con modelos más grandes, pero a una fracción del costo (basado en un rango observado de 3x-23x menos costo que los grandes modelos de frontera en varias pruebas de concepto iniciales).

Agregó que el informe técnico de Granite 3.0 y la guía de uso responsable proporcionan una descripción de los conjuntos de datos utilizados para entrenar estos modelos, detalles de los pasos de filtrado, limpieza y curación aplicados, junto con resultados integrales del rendimiento del modelo en los principales benchmarks académicos y empresariales.

Fundamentalmente, señaló Sandoval, IBM proporciona protección de la propiedad intelectual para todos los modelos Granite en watsonx.ai para que los clientes empresariales puedan tener más confianza en la fusión de sus datos con los modelos.

Los benchmarks de Granite 3.0

La ejecutiva anotó que los modelos de lenguaje Granite 3.0 también demuestran resultados prometedores en el rendimiento bruto.

"En los benchmarks académicos estándar definidos por la tabla de clasificación OpenLLM de Hugging Face, el rendimiento general del modelo Granite 3.0 8B Instruct lidera en promedio frente al rendimiento de los modelos de código abierto de tamaño similar de Meta y Mistral. En el benchmark de seguridad AttaQ de IBM, el modelo Granite 3.0 8B Instruct lidera todas las dimensiones de seguridad medidas en comparación con los modelos de Meta y Mistral, comentó Sandoval.

En todas las tareas empresariales principales de RAG, uso de herramientas y tareas en el campo de la ciberseguridad, la ejecutiva sostuvo que el modelo Granite 3.0 8B Instruct muestra un mayor rendimiento en promedio en comparación con los modelos de código abierto de tamaño similar de Mistral y Meta.

"Los modelos Granite 3.0 se entrenaron en más de 12 billones de tokens con datos tomados de 12 lenguajes naturales diferentes y 116 lenguajes de programación diferentes, utilizando un método de entrenamiento de dos etapas, aprovechando los resultados de varios miles de experimentos diseñados para optimizar la calidad de los datos, la selección de datos y los parámetros de entrenamiento. Para el final del año, se espera que los modelos de lenguaje 3.0 8B y 2B incluyan soporte para una ventana de contexto extendida de 128K y capacidades de comprensión de documentos multimodales, explicó la ejecutiva.

IBM ofrece sus modelos de arquitectura Granite Mixture of Experts (MoE), Granite 3.0 1B-A400M y Granite 3.0 3B-A800M, como modelos más pequeños y livianos que podrían implementarse para aplicaciones de baja latencia, así como implementaciones basadas en CPU.

IBM también está anunciando una versión actualizada de sus modelos preentrenados Granite Time Series, cuyas primeras versiones se lanzaron a principios de este año. "Estos nuevos modelos están entrenados con tres veces más datos y ofrecen un sólido rendimiento en los tres principales benchmarks de series de tiempo, superando a los modelos 10 veces más grandes de Google, Alibaba y otros. Los modelos actualizados también proporcionan una mayor flexibilidad de modelado con soporte para variables externas y pronósticos móviles, aseguró Sandoval.

Granite Guardian 3.0

Como parte de esta versión, IBM también está introduciendo una nueva familia de modelos Granite Guardian que aseguran permiten a los desarrolladores de aplicaciones implementar mecanismos de seguridad verificando los prompts del usuario y las respuestas del LLM para una variedad de riesgos.

"Además de las dimensiones de daño como el sesgo social, el odio, la toxicidad, la blasfemia, la violencia, el jailbreaking y más, estos modelos también proporcionan una gama de controles específicos de RAG únicos, como la fundamentación, la relevancia del contexto y la relevancia de la respuesta. En pruebas exhaustivas a través de 19 benchmarks de seguridad y RAG, el modelo Granite Guardian 3.0 8B tiene una mayor precisión general en la detección de daños en promedio que las tres generaciones de modelos Llama Guard de Meta. También mostró un rendimiento general a la par en la detección de alucinaciones en promedio con los modelos especializados de detección de alucinaciones WeCheck y MiniCheck, sostuvo Sandoval.

Añadió que, si bien los modelos Granite Guardian se derivan de los modelos de lenguaje Granite correspondientes, se pueden utilizar para implementar mecanismos de seguridad junto con cualquier modelo de IA abierto o propietario.

Disponibilidad de los modelos Granite 3.0

El conjunto completo de modelos Granite 3.0 y los modelos de series de tiempo actualizados están disponibles para su descarga en HuggingFace bajo la licencia permisiva Apache 2.0. Las variantes 'instruct' de los nuevos modelos de lenguaje Granite 3.0 8B y 2B y los modelos Granite Guardian 3.0 8B y 2B ya están disponibles para uso comercial en la plataforma watsonx de IBM. Una selección de los modelos Granite 3.0 también estará disponible como microservicios NVIDIA Nim y a través de las integraciones de Vertex AI Model Garden de Google Cloud con HuggingFace.

Para ayudar a proporcionar a los desarrolladores opciones y facilidad de uso y admitir implementaciones locales y perimetrales, también está disponible un conjunto seleccionado de los modelos Granite 3.0 en Ollama y Replicate.

Asistentes para los agentes

IBM también dio a conocer el próximo lanzamiento de la siguiente generación de watsonx Code Assistant, impulsado por modelos de código Granite, para ofrecer asistencia en la codificación de propósito general en lenguajes como C, C++, Go, Java y Python, con capacidades avanzadas de modernización de aplicaciones para Enterprise Java Applications. Las capacidades de código de Granite ahora también son accesibles a través de una extensión de Visual Studio Code, IBM Granite.Code.

IBM también planea lanzar nuevas herramientas para ayudar a los desarrolladores a construir, personalizar e implementar IA de manera más eficiente a través de watsonx.ai, incluyendo marcos para agentes autónomos, integraciones con entornos existentes y automatizaciones de código bajo para casos de uso comunes como RAG y agentes.

"IBM se centra en el desarrollo de tecnologías de agentes de IA que sean capaces de tener una mayor autonomía, un razonamiento sofisticado y la resolución de problemas en varios pasos. La versión inicial del modelo Granite 3.0 8B cuenta con soporte para capacidades para agentes autónomos claves, como el razonamiento avanzado y una plantilla de chat muy estructurada y un estilo de prompting para implementar flujos de trabajo de uso de herramientas. IBM también planea introducir una nueva función de chat de agentes de IA en IBM watsonx Orchestrate, que utiliza capacidades para agentes autónomos para orquestar asistentes de IA, habilidades y automatizaciones que ayudan a los usuarios a aumentar la productividad en sus equipos. IBM planea continuar desarrollando capacidades de agentes en toda su cartera en el 2025, incluyendo agentes preconstruidos para campos y casos de uso específicos, aseguró Sandoval.

Ampliación de la plataforma de entrega impulsada por IA

IBM también está anunciando una importante expansión de su plataforma de entrega impulsada por IA, IBM Consulting Advantage. "La plataforma multimodelo contiene agentes, aplicaciones y métodos de IA, como marcos repetibles, que pueden capacitar a 160 mil consultores de IBM para ofrecer un valor de cliente mejor y más rápido a un costo menor, sostuvo la ejecutiva.

La ejecutiva añadió que, como parte de la expansión, los modelos de lenguaje Granite 3.0 se convertirán en el modelo predeterminado en Consulting Advantage.

Otra parte clave de la expansión es la introducción de IBM Consulting Advantage for Cloud Transformation and Management e IBM Consulting Advantage for Business Operations. "Cada uno incluye agentes, aplicaciones y métodos de IA específicos del campo a los que se ha dado las mejores prácticas de IBM para que los consultores de IBM puedan ayudar a acelerar las transformaciones de la nube del cliente y la IA en tareas como la modernización del código y la ingeniería de calidad, o transformar y ejecutar operaciones en todos los campos como Finanzas, Recursos Humanos y Adquisiciones, finalizó Sandoval.

Llegamos a ustedes gracias a:


BrandPosts Qué es BrandPost

Más »
×
Los artículos publicados en esta sección -BrandPosts- son escritos y editados por los proveedores o miembros de la comunidad TI. BrandPosts crea una oportunidad para que un patrocinador proporcione información y comentarios desde su punto de vista, directamente a la audiencia de CTOPerú. El equipo editorial de CTOPerú no participa en la redacción o edición de estos BrandPosts.

Primer contacto

Más »

Recursos

Más »