
[10/04/2024] En el marco de Google Cloud Next 2024, Google realizó una serie de anuncios. Thomas Kurian, director ejecutivo de Google Cloud comenzó señalando que durante el último año han introducido más de mil avances de productos en Google Cloud y Workspace, ampliado su infraestructura a 40 regiones y anunciado nuevas inversiones en cables submarinos para conectar el mundo a nuestra nube con una baja latencia predecible. Anotó, asimismo, que han introducido nuevos modelos de última generación, incluidos sus modelos Gemini.
"Hoy, en Next '24, estamos haciendo anuncios importantes para impulsar el éxito y el impulso de los clientes, que incluyen: avances de silicio personalizados, como la disponibilidad general de TPU v5p y Google Axion, nuestra primera CPU personalizada basada en Arm diseñada para el centro de datos; Gemini 1.5 Pro, que incluye un gran avance en la comprensión del contexto largo, entrando en versión preliminar pública; nuevas capacidades de puesta a tierra en Vertex AI; Gemini Code Assist para desarrolladores; capacidades de ciberseguridad ampliadas con Gemini en Inteligencia de Amenazas; nuevas mejoras para Gemini en Google Workspace, y mucho más”, sostuvo el ejecutivo en una entrada de blog, anotando que estas innovaciones trascienden todos los aspectos de Google Cloud, entre los que se incluyen:
Escale con una infraestructura optimizada para IA
En el campo de la hipercomputadora de IA, una arquitectura que combina potentes TPU, GPU, software de IA, Kurian indicó que están anunciando avances clave para apoyar a los clientes en todas las capas de la pila:
A3 Mega: Desarrollada con NVIDIA utilizando GPU H100 Tensor Core, esta nueva instancia basada en GPU estará disponible de forma general el próximo mes y ofrecerá el doble de ancho de banda por GPU en comparación con las instancias A3, para soportar las cargas de trabajo más exigentes. También han anunciado Confidential A3, que permite a los clientes proteger mejor la confidencialidad e integridad de los datos confidenciales y las cargas de trabajo de IA durante el entrenamiento y la inferencia.
NVIDIA HGX B200 y NVIDIA GB200 NVL72: La última plataforma NVIDIA Blackwell llegará a Google Cloud a principios de 2025 en dos variaciones: la HGX B200 y la GB200 NVL72. El HGX B200 está diseñado para las cargas de trabajo más exigentes de IA, análisis de datos y HPC, mientras que el GB200 NVL72 impulsa la inferencia de modelos de lenguaje grandes en tiempo real y el rendimiento de entrenamiento a escala masiva para modelos a escala de billones de parámetros.
TPU v5p: Anunciaron la disponibilidad general de TPU v5p, el acelerador de IA para el entrenamiento y la inferencia. También anunciaron la disponibilidad de la compatibilidad de Google Kubernetes Engine (GKE) con TPU v5p.
Opciones de almacenamiento optimizadas para IA: Kurian indicó que están acelerando la velocidad de entrenamiento con nuevas funciones de almacenamiento en caché en Cloud Storage FUSE y Parallelstore, que mantienen los datos más cerca de la TPU o GPU de un cliente.
Nuevas opciones para Dynamic Workload Scheduler: El modo de calendario para garantizar la hora de inicio y el inicio flexible para optimizar la economía ayudarán a los clientes a garantizar una gestión eficiente de los recursos para la distribución de trabajos complejos de entrenamiento e inferencia.
"También estamos acercando la IA al lugar donde se generan y consumen los datos: al perímetro, a los entornos aislados, a las nubes soberanas de Google y a la nube cruzada. Estamos habilitando la IA en cualquier lugar a través de Google Distributed Cloud (GDC), lo que le permite elegir el entorno, la configuración y los controles que mejor se adapten a las necesidades específicas de su organización”, sostuvo Kurian.
El ejecutivo agregó que también están anunciando una serie de nuevas capacidades en GDC, entre las que se incluyen: GPU NVIDIA a GDC; GKE en GDC; la validación de una variedad de modelos de IA abiertos, incluidos Gemma, Llama 2 y más en GDC, para que se ejecuten en entornos perimetrales conectados y aislados; AlloyDB Omni para la búsqueda de vectores; y la nube soberana para cumplir con los requisitos normativos más estrictos.
Crear agentes con Vertex AI
Con relación a Vertex AI, su plataforma de IA empresarial, la compañía está ofreciendo un acceso ampliado a una variedad de modelos:
Gemini 1.5 Pro: Gemini 1.5 Pro ofrece dos tamaños de ventanas de contexto: 128K tokens y 1 millón de tokens, y ahora está disponible en versión preliminar pública. Además, anunciaron la capacidad de procesar archivos de audio, incluidos videos con audio. Los clientes pueden procesar grandes cantidades de información en una sola transmisión, incluyendo una hora de video, 11 horas de audio, bases de código con más de 30 mil líneas de código o más de 700 mil palabras.
Claude 3: Claude 3 Sonnet y Claude 3 Haiku, los modelos de última generación de Anthropic, están disponibles de forma general en Vertex AI, y Claude 3 Opus estará disponible en las próximas semanas.
CodeGemma: Gemma es una familia de modelos abiertos ligeros y de última generación construidos con la misma investigación y tecnología utilizada para crear los modelos Gemini. Una nueva versión ajustada de Gemma diseñada para la generación de código y la asistencia de código, CodeGemma, ya está disponible en Vertex AI.
Imagen 2.0: Kurian comentó que una nueva capacidad de texto a imagen en vivo permite a los equipos creativos y de marketing generar imágenes animadas, como gifs, que están equipadas con filtros de seguridad y marcas de agua digitales. Además, anunciamos la disponibilidad general de funciones avanzadas de edición de fotos, que incluyen inpainting y outpainting, y mucho más.
Marca de agua digital: Impulsado por SynthID de Google DeepMind, Google anunció que está disponible de forma general para imágenes generadas por IA producidas por Imagen 2.0.
Acelerar el desarrollo
Sobre Gemini Code Assist, su solución de asistencia de código de IA centrada en la empresa, Kurian señaló que ahora es compatible con su base de código privada para estar en cualquier lugar: en las instalaciones, GitHub, GitLab, Bitbucket o incluso en varias ubicaciones. Anotó, asimismo que están haciendo anuncios clave como:
Gemini 1.5 Pro en Gemini Code Assist: Esta actualización, ahora en versión preliminar privada, trae una ventana de contexto masiva de un millón de tokens. Gemini Code Assist ahora ofrece sugerencias de código aún más precisas, información más profunda y flujos de trabajo optimizados.
Gemini Cloud Assist: Proporciona asistencia de IA a lo largo del ciclo de vida de su aplicación, lo que facilita el diseño, la seguridad, el funcionamiento, la resolución de problemas y la optimización del rendimiento y los costos de su aplicación.
Mejorar la postura de ciberseguridad
Kurian comentó que están anunciando nuevas innovaciones impulsadas por IA en toda su cartera de seguridad, anotando que están diseñadas para ofrecer resultados de seguridad más sólidos:
Gemini en Inteligencia de amenazas: Utiliza el lenguaje natural para ofrecer una visión profunda sobre el comportamiento de los actores de amenazas. "Con Gemini, podemos analizar muestras mucho más grandes de código potencialmente malicioso. La ventana de contexto más grande de Gemini permite el análisis de las interacciones entre los módulos, lo que proporciona una nueva visión de la verdadera intención del código”, indicó el ejecutivo.
Gemini en operaciones de seguridad: Kurian indicó que una nueva función de investigación asistida convierte el lenguaje natural en detecciones, resume los datos de eventos, recomienda acciones a realizar y navega a los usuarios a través de la plataforma a través del chat conversacional.
Aumentar la productividad
Dentro del campo de Google Workspace, Kurian indicó que están anunciando la próxima ola de innovaciones y mejoras de Gemini para Google Workspace, que incluyen:
Google Vids: Esta nueva aplicación de creación de videos impulsada por IA para el trabajo es su asistente de video, escritura, producción y edición, todo en uno. "Puede generar un guión gráfico que puede editar fácilmente y, después de elegir un estilo, arma su primer borrador con escenas sugeridas de videos de archivo, imágenes y música de fondo. También puede ayudarle a transmitir su mensaje con la voz en off adecuada, ya sea eligiendo una de nuestras voces en off preestablecidas o usando la suya propia. Los videos se colocarán junto a otras aplicaciones de Workspace como Documentos, Hojas de cálculo y Presentaciones. Incluye una interfaz sencilla y fácil de usar y la posibilidad de colaborar y compartir proyectos de forma segura desde el navegador. Vids se lanzará en Workspace Labs en junio”, comentó el ejecutivo.
Complemento de reuniones y mensajería con IA: Con el complemento "toma notas por mí", el resumen del chat y la traducción en tiempo real en 69 idiomas (equivalente a 4.600 pares de idiomas), esta herramienta de colaboración sólo costará 10 dólares por usuario, al mes.
Nuevo complemento de seguridad de IA: Los administradores del espacio de trabajo ahora pueden clasificar y proteger automáticamente los archivos y datos confidenciales mediante modelos de IA que preservan la privacidad y controles de prevención de pérdida de datos entrenados para su organización, sostuvo Kurian . El complemento AI Security está disponible por 10 dólares por usuario, por mes y se puede agregar a la mayoría de los planes de Workspace.
Partners del año
El evento también fue el marco en que Google Cloud premió a los socios que han estado a la vanguardia de la innovación, ayudando a sus clientes a adoptar estas tecnologías para lograr sus objetivos.
"Los ganadores del premio de este año son un testimonio del poder de la creatividad, la colaboración y el enfoque en el cliente. Estamos orgullosos de asociarnos con empresas con visión de futuro. Nuestras asociaciones son fundamentales para la nueva forma de acceder a la nube, y esperamos ver lo que podemos lograr juntos en el futuro”, sostuvo Kevin Ichhpurani, vicepresidente corporativo del, Ecosistema Global de Socios y Canales, en una entrada de blog, donde se encuentra la relación completa.
Franca Cavassa, CTOPerú