[21/03/2024] Databricks anunció que está adquiriendo Lilac, con sede en Boston, para ayudar a las empresas a explorar y utilizar sus datos no estructurados para crear aplicaciones basadas en IA generativa. Según lo señalado en el comunicado de prensa, Lilac es una herramienta escalable y fácil de usar para que los científicos de datos busquen, agrupen y analicen cualquier tipo de conjunto de datos de texto con un enfoque en la IA generativa.
"Lilac se puede utilizar para una variedad de casos de uso, desde la evaluación de los resultados de grandes modelos de lenguaje (LLM) hasta la comprensión y preparación de conjuntos de datos no estructurados para el entrenamiento de modelos. La integración de las herramientas de Lilac en Databricks ayudará a los clientes a acelerar el desarrollo de aplicaciones de IA generativa de calidad de producción utilizando sus propios datos empresariales”, sostuvo Akhil Gupta, vicepresidente de ingeniería en Databricks.
El ejecutivo agregó que Lilac, en esencia, facilita la exploración de datos no estructurados: es una herramienta encantadora para que los científicos de datos y los investigadores de IA exploren, comprendan y modifiquen conjuntos de datos de texto de una manera manejable.
"Lilac ha innovado en este espacio al ofrecer una solución escalable que fomenta y facilita la interacción con los datos. Con una interfaz de usuario intuitiva y funciones aumentadas por IA, Lilac permite a los científicos e investigadores de datos explorar grupos de datos, derivar nuevas categorías de datos utilizando la retroalimentación humana y los clasificadores, y adaptar los conjuntos de datos en función de estos conocimientos. El equipo detrás de Lilac creó específicamente su producto para permitir el análisis de los resultados del modelo en busca de sesgo o toxicidad, y la preparación de datos para RAG y el ajuste fino o pre-entrenamiento de LLM”, indicó Gupta.
Los fundadores de Lilac, Daniel Smilkov y Nikhil Thorat, pasaron una década en Google perfeccionando su experiencia en el desarrollo de soluciones de calidad de datos a escala empresarial.
Franca Cavassa, CTOPerú