
[03/06/2025] Google Cloud anunció una serie de innovaciones en su lakehouse impulsado por IA señalando que establece un nuevo estándar de apertura, inteligencia y rendimiento.
"Google Data Cloud es una plataforma integrada única construida sobre la infraestructura a escala planetaria de Google, infundida con IA, y cuenta con una arquitectura de lago abierta para datos multimodales”, sostuvo Andi Gutmans, vicepresidente y director general de Data Cloud, Google Cloud, en una entrada de blog.
El ejecutivo anotó que estas innovaciones incluyen:
- Almacenamiento nativo de BigLake Iceberg: Aprovecha el almacenamiento en la nube (GCS) de Google para proporcionar una experiencia de nivel empresarial para administrar e interoperar con los datos de Iceberg. Esto incluye tablas de BigLake para Apache Iceberg (GA) y BigLake Metastore con una nueva API de catálogo REST (versión preliminar).
- Motores operativos y analíticos unificados: Sobre la base de BigLake, los clientes pueden interoperar sin problemas en la misma base de datos abiertos de Iceberg utilizando BigQuery para cargas de trabajo analíticas (GA) y AlloyDB para PostgreSQL (versión preliminar) para satisfacer las necesidades operativas.
- Aceleración del rendimiento para BigQuery SQL: Ofrece un conjunto de mejoras automatizadas en el motor SQL para un procesamiento de datos significativamente más rápido y ágil, con el entorno de ejecución avanzado de BigQuery, una API de consulta de baja latencia, indexación de metadatos de columnas y una aceleración de orden de magnitud para actualizaciones/eliminaciones detalladas.
- Lightning Engine de alto rendimiento para Apache Spark: La versión preliminar de Lightning Engine está diseñada para potenciar Apache Spark, aprovechando los conectores de datos optimizados, las operaciones eficientes de reproducción aleatoria en columnas, el almacenamiento en caché incorporado y la ejecución vectorizada.
- Dataplex Universal Catalog: Amplía la inteligencia impulsada por IA y la gobernanza unificada en todo el patrimonio de datos de Google Cloud al descubrir y organizar automáticamente los metadatos de los datos a la IA (incluidos los modelos de IA BigLake Iceberg, BigQuery, Spanner, Vertex AI), lo que permite la aplicación central de políticas a través de BigLake y admite la curación, la información de datos y la búsqueda semántica impulsadas por IA.
- Blocs de notas y herramientas nativos de IA: Las experiencias de los desarrolladores mejoran con los blocs de notas con tecnología Gemini, la generación de código PySpark y las extensiones de código para JupyterLab y Visual Studio Code. Además, las interfaces de portátiles de terceros ahora ofrecen experiencias mejoradas e integradas.
Más información aquí.
Franca Cavassa, CTOPerú