Noticias

Google introduce innovaciones en su lakehouse

Diseñado para la IA, los datos abiertos y un mayor rendimiento

[03/06/2025] Google Cloud anunció una serie de innovaciones en su lakehouse impulsado por IA señalando que establece un nuevo estándar de apertura, inteligencia y rendimiento.

"Google Data Cloud es una plataforma integrada única construida sobre la infraestructura a escala planetaria de Google, infundida con IA, y cuenta con una arquitectura de lago abierta para datos multimodales, sostuvo Andi Gutmans, vicepresidente y director general de Data Cloud, Google Cloud, en una entrada de blog.

El ejecutivo anotó que estas innovaciones incluyen:

  • Almacenamiento nativo de BigLake Iceberg: Aprovecha el almacenamiento en la nube (GCS) de Google para proporcionar una experiencia de nivel empresarial para administrar e interoperar con los datos de Iceberg. Esto incluye tablas de BigLake para Apache Iceberg (GA) y BigLake Metastore con una nueva API de catálogo REST (versión preliminar).
  • Motores operativos y analíticos unificados: Sobre la base de BigLake, los clientes pueden interoperar sin problemas en la misma base de datos abiertos de Iceberg utilizando BigQuery para cargas de trabajo analíticas (GA) y AlloyDB para PostgreSQL (versión preliminar) para satisfacer las necesidades operativas.
  • Aceleración del rendimiento para BigQuery SQL: Ofrece un conjunto de mejoras automatizadas en el motor SQL para un procesamiento de datos significativamente más rápido y ágil, con el entorno de ejecución avanzado de BigQuery, una API de consulta de baja latencia, indexación de metadatos de columnas y una aceleración de orden de magnitud para actualizaciones/eliminaciones detalladas.
  • Lightning Engine de alto rendimiento para Apache Spark: La versión preliminar de Lightning Engine está diseñada para potenciar Apache Spark, aprovechando los conectores de datos optimizados, las operaciones eficientes de reproducción aleatoria en columnas, el almacenamiento en caché incorporado y la ejecución vectorizada.
  • Dataplex Universal Catalog: Amplía la inteligencia impulsada por IA y la gobernanza unificada en todo el patrimonio de datos de Google Cloud al descubrir y organizar automáticamente los metadatos de los datos a la IA (incluidos los modelos de IA BigLake Iceberg, BigQuery, Spanner, Vertex AI), lo que permite la aplicación central de políticas a través de BigLake y admite la curación, la información de datos y la búsqueda semántica impulsadas por IA.
  • Blocs de notas y herramientas nativos de IA: Las experiencias de los desarrolladores mejoran con los blocs de notas con tecnología Gemini, la generación de código PySpark y las extensiones de código para JupyterLab y Visual Studio Code. Además, las interfaces de portátiles de terceros ahora ofrecen experiencias mejoradas e integradas.

Más información aquí.

Llegamos a ustedes gracias a:


BrandPosts Qué es BrandPost

Más »
×
Los artículos publicados en esta sección -BrandPosts- son escritos y editados por los proveedores o miembros de la comunidad TI. BrandPosts crea una oportunidad para que un patrocinador proporcione información y comentarios desde su punto de vista, directamente a la audiencia de CTOPerú. El equipo editorial de CTOPerú no participa en la redacción o edición de estos BrandPosts.

Primer contacto

Más »

Recursos

Más »