[28/06/2024] Oracle anunció la disponibilidad general de HeatWave GenAI, que incluye los primeros modelos de lenguaje grande (LLM) en la base de datos, un almacén de vectores automatizado en la base de datos, procesamiento de vectores escalable y la capacidad de tener conversaciones contextuales en lenguaje natural informadas por contenido no estructurado. Según lo señalado en el comunicado de prensa, estas nuevas capacidades permiten a los clientes llevar el poder de la IA generativa a los datos de su empresa, sin necesidad de tener experiencia en IA ni tener que mover datos a una base de datos vectorial separada. HeatWave GenAI está disponible de inmediato en todas las regiones de Oracle Cloud, en la región dedicada de Oracle Cloud Infrastructure (OCI) y en todas las nubes sin costo adicional para los clientes de HeatWave.
"Con HeatWave GenAI, los desarrolladores pueden crear un almacén de vectores para contenido empresarial no estructurado con un solo comando SQL, utilizando modelos de incrustación integrados. Los usuarios pueden realizar búsquedas en lenguaje natural en un solo paso utilizando LLM en la base de datos o externos. Los datos no salen de la base de datos y, debido a la escala y el rendimiento extremos de HeatWave, no es necesario aprovisionar GPU. Como resultado, los desarrolladores pueden reducir la complejidad de las aplicaciones, aumentar el rendimiento, mejorar la seguridad de los datos y reducir los costos”, sostuvo Edward Screven, arquitecto corporativo jefe de Oracle.
El ejecutivo anotó que las nuevas funciones de IA generativa automatizadas e integradas incluyen:
- Los LLM en la base de datos simplifican el desarrollo de aplicaciones de IA generativa a un costo menor. "Los clientes pueden beneficiarse de la IA generativa sin la complejidad de la selección e integración de LLM externos, y sin preocuparse por la disponibilidad de LLM en los centros de datos de varios proveedores de nube. Los LLM en la base de datos permiten a los clientes buscar datos, generar o resumir contenido y realizar la generación aumentada de recuperación (RAG) con HeatWave Vector Store. Además, pueden combinar la IA generativa con otras capacidades integradas de HeatWave, como AutoML, para crear aplicaciones más completas. HeatWave GenAI también se integra con el servicio de IA generativa de OCI para acceder a modelos básicos preentrenados de los principales proveedores de LLM”, anotó Screven.
- El almacenamiento automatizado de vectores en la base de datos permite a los clientes utilizar la IA generativa con sus documentos empresariales sin mover los datos a una base de datos vectorial separada y sin experiencia en IA. "Todos los pasos para crear un almacén de vectores y las incrustaciones de vectores se automatizan y ejecutan dentro de la base de datos, incluido el descubrimiento de los documentos en el almacenamiento de objetos, el análisis de los mismos, la generación de incrustaciones de una manera altamente paralela y optimizada, y la inserción en el almacén de vectores, lo que hace que HeatWave Vector Store sea eficiente y fácil de usar. El uso de un almacén de vectores para RAG ayuda a resolver el desafío de la alucinación de los LLM, ya que los modelos pueden buscar datos patentados con el contexto adecuado para proporcionar respuestas más precisas y relevantes”, explicó el ejecutivo.
- El procesamiento vectorial de escalabilidad horizontal ofrece resultados de búsqueda semántica muy rápidos sin pérdida de precisión. Screven indicó que HeatWave admite un nuevo tipo de datos VECTOR nativo y una implementación optimizada de la función de distancia, lo que permite a los clientes realizar consultas semánticas con SQL estándar. "La representación en columnas híbrida en memoria y la arquitectura de escalabilidad horizontal de HeatWave permiten que el procesamiento vectorial se ejecute con un ancho de banda cercano a la memoria y se paralelice en hasta 512 nodos de HeatWave. Como resultado, los clientes obtienen respuestas a sus preguntas rápidamente. Los usuarios también pueden combinar la búsqueda semántica con otros operadores SQL para, por ejemplo, unir varias tablas con diferentes documentos y realizar búsquedas de similitud en todos los documentos”.
- HeatWave Chat es un complemento de código visual para MySQL Shell que proporciona una interfaz gráfica para HeatWave GenAI y permite a los desarrolladores hacer preguntas en lenguaje natural o SQL. "El Lakehouse Navigator integrado permite a los usuarios seleccionar archivos del almacenamiento de objetos y crear un almacén de vectores. Los usuarios pueden buscar en toda la base de datos o restringir la búsqueda a una carpeta. HeatWave mantiene el contexto con el historial de preguntas formuladas, las citas de los documentos de origen y el aviso al LLM. Esto facilita una conversación contextual y permite a los usuarios verificar la fuente de las respuestas generadas por el LLM. Este contexto se mantiene en HeatWave y está disponible para cualquier aplicación que utilice HeatWave”, anotó el ejecutivo.
Franca Cavassa, CTOPerú