[04/06/2024] NVIDIA ha anunciado la adopción generalizada de la plataforma de red Ethernet NVIDIA Spectrum-X, así como un calendario acelerado de lanzamiento de productos.
Varios socios de NVIDIA han anunciado productos basados en Spectrum, incluidos ASRock Rack, ASUS, GIGABYTE, Ingrasys, Inventec, Pegatron, QCT, Wistron y Wiwynn, que se unen a Dell Technologies, Hewlett Packard Enterprise, Lenovo y Supermicro en la incorporación de la plataforma a sus ofertas.
"Los rápidos avances en tecnologías revolucionarias como la IA generativa subrayan la necesidad de que todas las empresas prioricen la innovación en redes para obtener una ventaja competitiva", comentó Gilad Shainer, vicepresidente senior de redes de NVIDIA, en el comunicado de prensa. "NVIDIA Spectrum-X revoluciona las redes Ethernet para permitir que las empresas aprovechen al máximo el poder de sus infraestructuras de IA para transformar sus operaciones y sus industrias".
Según el ejecutivo, Spectrum-X es una estructura Ethernet creada para IA, que acelera el rendimiento de la red de IA generativa en 1,6 veces en comparación con las estructuras Ethernet tradicionales.
Para satisfacer la fuerte demanda de la industria por el rendimiento que ofrece Spectrum, el fundador y CEO de NVIDIA, Jensen Huang, anunció durante su discurso de apertura de COMPUTEX en Taiwán que NVIDIA planea lanzar nuevos productos Spectrum-X cada año, ofreciendo un mayor ancho de banda y puertos y conjuntos de funciones de software mejorados y capacidad de programación para impulsar el rendimiento líder de las redes Ethernet de IA.
"Con el conmutador Ethernet NVIDIA Spectrum SN5600 y el NVIDIA BlueField -3 SuperNIC, Spectrum-X es una plataforma de extremo a extremo construida con el rendimiento y las características requeridas por las nubes de IA generativa. Aprovechando el enrutamiento adaptativo y el control de congestión para obtener el máximo ancho de banda y aislamiento de ruido, ofrece la red Ethernet de mayor rendimiento para IA, proporcionando resultados predecibles para miles de trabajos simultáneos de IA a todas las escalas”, indicó Shainer.
En combinación con las DPU NVIDIA BlueField-3, el ejecutivo anotó que la plataforma permite la multitenencia avanzada en la nube, la elasticidad de cómputo de la GPU y la seguridad de confianza cero. "Con él, los proveedores de servicios en la nube pueden acelerar el desarrollo y la implementación de soluciones de IA al tiempo que mejoran su retorno de la inversión”.
PC GeForce RTX AI
NVIDIA ha anunciado también la nueva tecnología NVIDIA RTX para potenciar los asistentes de IA y los humanos digitales que se ejecutan en los nuevos portátiles GeForce RTX con IA.
NVIDIA presentó Project G-Assist, una demostración de tecnología de asistente de IA impulsada por RTX que brinda ayuda sensible al contexto para juegos y aplicaciones de PC. La demo técnica de Project G-Assist debutó con ARK: Survival Ascended de Studio Wildcard. NVIDIA también presentó los primeros microservicios de inferencia NVIDIA NIM basados en PC para la plataforma humana digital NVIDIA ACE.
"Estas tecnologías están habilitadas por el kit de herramientas de IA de NVIDIA RTX, un nuevo conjunto de herramientas y kits de desarrollo de software que ayudan a los desarrolladores a optimizar e implementar grandes modelos de IA generativa en PC con Windows. Se unen a las innovaciones de IA RTX de pila completa de NVIDIA, que aceleran más de 500 aplicaciones y juegos de PC y 200 diseños de portátiles de fabricantes”, señaló Jason Paul, vicepresidente de IA de consumo de NVIDIA, en el comunicado de prensa.
Además, anotó el ejecutivo, las laptops RTX AI PC recientemente anunciadas de ASUS y MSI cuentan con GPU GeForce RTX 4070 y sistemas en un chip de bajo consumo con capacidades de PC con IA de Windows 11. Estos PC con IA con Windows 11 recibirán una actualización gratuita de las experiencias de Copilot+ PC cuando estén disponibles.
Project G-Assist, un asistente de IA de GeForce
Paul sostuvo que los asistentes de IA están configurados para transformar los juegos y las experiencias en la aplicación, desde ofrecer estrategias de juego y analizar repeticiones multijugador hasta ayudar con flujos de trabajo creativos complejos. "El Proyecto G-Assist es un vistazo a este futuro”.
Los juegos de PC ofrecen vastos universos para explorar y mecánicas intrincadas para dominar, que son hazañas desafiantes y que requieren mucho tiempo incluso para los jugadores más dedicados. El proyecto G-Assist tiene como objetivo poner el conocimiento del juego al alcance de los jugadores utilizando IA generativa.
"Project G-Assist toma entradas de voz o texto del jugador, junto con información contextual de la pantalla del juego, y ejecuta los datos a través de modelos de visión de IA. Estos modelos mejoran el conocimiento contextual y la comprensión específica de la aplicación de un modelo de lenguaje grande (LLM) vinculado a una base de datos de conocimiento del juego y, a continuación, generan una respuesta personalizada entregada como texto o voz”, explicó Paul.
Además, agregó, Project G-Assist puede configurar el sistema de juego del jugador para obtener un rendimiento y una eficiencia óptimos. "Puede proporcionar información sobre las métricas de rendimiento, optimizar la configuración de gráficos en función del hardware del usuario, aplicar un overclock seguro e incluso reducir de forma inteligente el consumo de energía mientras se mantiene un objetivo de rendimiento”.
Windows Copilot Runtime agregará aceleración de GPU para SLM de PC local
Microsoft y NVIDIA están colaborando para ayudar a los desarrolladores a incorporar nuevas capacidades de IA generativa a sus aplicaciones web y nativas de Windows. De acuerdo con el ejecutivo, esta colaboración proporcionará a los desarrolladores de aplicaciones un fácil acceso a la interfaz de programación de aplicaciones (API) a los modelos de lenguaje pequeño (SLM) acelerados por GPU que permiten las capacidades de generación aumentada de recuperación (RAG) que se ejecutan en el dispositivo como parte de Windows Copilot Runtime.
"Los SLM ofrecen enormes posibilidades para los desarrolladores de Windows, incluido el resumen de contenido, la generación de contenido y la automatización de tareas. Las capacidades de RAG aumentan los SLM al dar a los modelos de IA acceso a información específica del dominio que no está bien representada en los modelos base. Las API de RAG permiten a los desarrolladores aprovechar las fuentes de datos específicas de la aplicación y ajustar el comportamiento y las capacidades de SLM a las necesidades de la aplicación”, señaló Paul.
Agregó que estas capacidades de IA se verán aceleradas por las GPU NVIDIA RTX, así como por los aceleradores de IA de otros proveedores de hardware, proporcionando a los usuarios finales experiencias de IA rápidas y con capacidad de respuesta en todo el ecosistema de Windows.
La API se lanzará en versión preliminar para desarrolladores a finales de este año.
Kit de herramientas de IA RTX
El ejecutivo anotó que el ecosistema de IA ha creado cientos de miles de modelos de código abierto para que los desarrolladores de aplicaciones los aprovechen, pero la mayoría de los modelos están preentrenados para fines generales y construidos para ejecutarse en un centro de datos.
"Para ayudar a los desarrolladores a crear modelos de IA específicos de la aplicación que se ejecuten en PC, NVIDIA presentó RTX AI Toolkit, un conjunto de herramientas y SDK para la personalización, optimización e implementación de modelos en PC RTX AI. RTX AI Toolkit estará disponible a finales de este mes para un acceso más amplio a los desarrolladores.
"Los desarrolladores pueden personalizar un modelo previamente entrenado con herramientas QLoRa de código abierto. Luego, pueden usar el optimizador de modelos NVIDIA TensorRT para cuantificar modelos para consumir hasta tres veces menos RAM. A continuación, NVIDIA TensorRT Cloud optimiza el modelo para obtener el máximo rendimiento en todas las líneas de GPU RTX. El resultado es un rendimiento hasta cuatro veces más rápido en comparación con el modelo previamente entrenado”, sostuvo Paul.
Agregó que el nuevo SDK de NVIDIA AI Inference Manager, ahora disponible en acceso anticipado, simplifica la implementación de ACE en PC. "Preconfigura la PC con los modelos, motores y dependencias de IA necesarios, al tiempo que orquesta la inferencia de IA sin problemas en las PC y la nube”.
Los componentes del kit de herramientas de IA RTX, como TensorRT-LLM, están integrados en marcos de desarrollo y aplicaciones populares para IA generativa, incluidos Automatic1111, ComfyUI, Jan.AI, LangChain, LlamaIndex, Oobabooga y Sanctum.AI.
IA para la creación de contenido
NVIDIA también está integrando la aceleración de IA RTX en aplicaciones para creadores, modders y entusiastas del video.
"El año pasado, NVIDIA introdujo la aceleración RTX utilizando TensorRT para una de las interfaces de usuario de Stable Diffusion más populares, Automatic1111. A partir de esta semana, RTX también acelerará la popular ComfyUI, ofreciendo hasta un 60% de mejora en el rendimiento con respecto a la versión que se envía actualmente, y un rendimiento siete veces más rápido en comparación con el MacBook Pro M3 Max”, comentó Paul.
Añadió que NVIDIA RTX Remix es una plataforma de modificación para remasterizar juegos clásicos de DirectX 8 y DirectX 9 con trazado de rayos completo, NVIDIA DLSS 3.5 y materiales físicamente precisos. RTX Remix incluye un renderizador en tiempo de ejecución y la aplicación RTX Remix Toolkit, que facilita la modificación de activos y materiales del juego.
El ejecutivo señaló, asimismo que, este mes, NVIDIA hará que el RTX Remix Toolkit sea de código abierto, lo que permitirá a los modders optimizar la forma en que se reemplazan los activos y se vuelven a iluminar las escenas, aumentar los formatos de archivo compatibles con la ingesta de activos de RTX Remix, y reforzar las herramientas de textura de IA de RTX Remix con nuevos modelos.
Además, NVIDIA está haciendo que las capacidades de RTX Remix Toolkit sean accesibles a través de una API REST, lo que permite a los modders vincular en vivo RTX Remix a herramientas de creación de contenido digital como Blender, herramientas de modificación como Hammer y aplicaciones de IA generativa como ComfyUI. NVIDIA también proporciona un SDK para RTX Remix Runtime para permitir a los modders implementar el renderizador de RTX Remix en otras aplicaciones y juegos más allá de los clásicos de DirectX 8 y 9.
Paul indicó que, NVIDIA RTX Video, la función de superresolución impulsada por IA compatible con los navegadores Google Chrome, Microsoft Edge y Mozilla Firefox, ahora está disponible como SDK para todos los desarrolladores, ayudándoles a integrar de forma nativa la IA para el escalado, la nitidez, la reducción de artefactos de compresión y la conversión de alto rango dinámico (HDR).
Franca Cavassa, CTOPerú