Noticias

Google presentó sus modelos abiertos Gemma

Haciendo hincapié en la seguridad

[23/02/2024] Google anunció una nueva generación de modelos abiertos de Google con la intención de ayudar a los desarrolladores e investigadores a crear IA de manera responsable.

"Gemma es una familia de modelos abiertos ligeros y de última generación construidos a partir de la misma investigación y tecnología utilizada para crear los modelos Gemini. Desarrollado por Google DeepMind y otros equipos de Google, Gemma está inspirado en Géminis, y el nombre refleja el latín gemma, que significa "piedra preciosa". Junto con nuestros modelos, también estamos lanzando herramientas para respaldar la innovación de los desarrolladores, fomentar la colaboración y guiar el uso responsable de los modelos de Gemma, sostuvo Tris Warkentin, director de Google DeepMind, en una entrada de blog.

Gemma ya está disponible en todo el mundo y, de acuerdo al ejecutivo, estos son los detalles clave que debe conocer:

  • Se han lanzados modelos en dos tamaños: Gemma 2B y Gemma 7B. Cada tamaño se lanza con variantes preentrenadas y ajustadas a la instrucción.
  • Un nuevo kit de herramientas de IA generativa responsable proporciona orientación y herramientas esenciales para crear aplicaciones de IA más seguras con Gemma.
  • Google proporciona cadenas de herramientas para la inferencia y el ajuste fino supervisado (SFT) en todos los marcos principales: JAX, PyTorch y TensorFlow a través de Keras 3.0 nativo.
  • Los notebooks Colab y Kaggle listos para usar, junto con la integración con herramientas populares como Hugging Face, MaxText, NVIDIA NeMo y TensorRT-LLM, facilitan la introducción a Gemma.
  • Los modelos Gemma preentrenados y ajustados a las instrucciones pueden ejecutarse en su portátil, estación de trabajo o Google Cloud con una sencilla implementación en Vertex AI y Google Kubernetes Engine (GKE).
  • La optimización en múltiples plataformas de hardware de IA garantiza un alto rendimiento, incluidas las GPU de NVIDIA y las TPU de Google Cloud.
  • Los términos de uso permiten el uso comercial responsable y la distribución para todas las organizaciones, independientemente de su tamaño.

"Los modelos Gemma comparten componentes técnicos y de infraestructura con Gemini, nuestro modelo de IA más grande y capaz disponible en la actualidad. Esto permite que Gemma 2B y 7B alcancen el mejor rendimiento de su clase para sus tamaños en comparación con otros modelos abiertos. Además, los modelos Gemma pueden ejecutarse directamente en una computadora portátil o de escritorio. En particular, Gemma supera a modelos mucho más grandes en los principales parámetros de referencia, al tiempo que cumple nuestras rigurosas normas de producción segura y responsable, indicó Warkentin, añadiendo que se puede consultar su informe técnico para obtener más información sobre el rendimiento, la composición del conjunto de datos y las metodologías de modelización.

Llegamos a ustedes gracias a:


BrandPosts Qué es BrandPost

Más »
×
Los artículos publicados en esta sección -BrandPosts- son escritos y editados por los proveedores o miembros de la comunidad TI. BrandPosts crea una oportunidad para que un patrocinador proporcione información y comentarios desde su punto de vista, directamente a la audiencia de CTO Perú. El equipo editorial de CTO Perú no participa en la redacción o edición de estos BrandPosts.

Primer contacto

Más »

Casos de éxito

Más »