¿Por qué me gusta tanto Snowflake?

En la entrada de hoy quiero poner en valor lo bien que están haciendo las cosas en Snowflake y porque para mi cada vez toma más relevancia en el ecosistema de datos, no sólo por su tecnología, sino por el modo en que están avanzando y el «no miedo» a facilitar la vida a los equipos. Para ello, destaco algunos de los punto que considero más relevantes para mi y los comparto con vosotros:

El primer punto es que puedes usar lenguajes diversos como Python, R, SQL para desarrollar las transformaciones que desees sobre tus datos. Y como comprenderás, para alguien que comenzó su carrera en datos en el área de Business Intelligence hace casi 20 años,… es un UP importante.

El segundo es que su motor es SQL y esto simplifica en gran manera el mantenimiento de la solución. No hay runtimes de Spark actualizándose cada cierto tiempo y «obligando» a hacer upgrades de la plataforma, lo que en ocasiones supone un pequeño (o no tan pequeño) dolor de cabeza.

Lo tercero, es que están haciendo un gran esfuerzo por crear una Suite que englobe todo aquello relevante en una plataforma inteligente de datos. ¡Me explico!
Hace unos meses Snowflake adquirió Datavolo, para ofrecer a los ingenieros de datos una solución basada en Apache Nifi para poder crear todos los procesos de integración que necesiten.
Enlace a la noticias: https://www.snowflake.com/en/engineering-blog/snowflake-datavolo-multimodal-data-integration-platform/

El cuarto, que está adoptando formatos abiertos y cediendo algunos de sus proyectos a la comunidad. Esto sucede con:

  • La incorporación de Apache Iceberg como formato open source para la persistencia de los datos en el Data Lake. Esto permite que los sistemas de ficheros se comporten como Bases de Datos tradicionales gracias al cumplimiento de las reglas ACID. Además, a día de hoy el performance y las capacidades que Snowflake está logrando prácticamente igualan a los beneficios que tiene el uso de tablas propietarias. Sin duda, un gran punto y una gran recomendación a todas las organizaciones que desean abrazar las mejores prácticas en sus plataformas de datos.

    Dejo aquí más información: https://www.snowflake.com/en/blog/expanding-the-data-cloud-with-apache-iceberg/
  • Horizon Catalog, es el proyecto de Gobierno de Datos de Snowflake para gestionar la seguridad, privacidad, el descubrimiento y el buen gobierno de los datos. Además, está construido sobre la API de Apache Atlas, lo que vuelve a destacar la apuesta de Snowflake por la comunidad y los proyectos open source. ¡Enhorabuena!

    Dejo aquí más información: https://docs.snowflake.com/en/user-guide/snowflake-horizon

El quinto punto es lo bien que están haciendo las cosas en cuanto a la evolución de Snowpark Container Services. Su rápida evolución está permitiendo mover soluciones custom sobre tecnologías diversas a Snowflake y así eliminar la complejidad de las arquitecturas. Esto también es extensible a la parte de MLOps, donde el trabajo por integrar elementos para la explicabilidad y la observabilidad de los modelos, de manera nativa, sin duda aportan gran valor a las organizaciones que deciden simplificar su stack.

Y por último, el sexto es que no tienen miedo a integrarse con otras soluciones de datos. El ejemplo, Microsoft Fabric. El slogan «Better Together» es cada vez más relevante y me encanta que las organizaciones abran el ecosistema facilitando integraciones como el servicio de Mirroring que permite persistir datos en formato parquet desde Snowflake a Microsoft Fabric de un modo sumamente sencillo.

Dejo aquí más información: https://learn.microsoft.com/en-us/fabric/database/mirrored-database/snowflake

Pues eso, que Snowflake está haciendo las cosas bien y es lógico agradecer lo mucho que están haciendo por ayudar a las organizaciones a explotar los datos para obtener conocimiento desde un prisma colaborativo y abierto a la comunidad. ¡Enhorabuena!

Foto de portada, gracias a Anastasia Shuraeva: https://www.pexels.com/es-es/foto/creativo-mano-pared-muro-6964701/

Publicado por alb3rtoalonso

Soy un enamorado del poder de los datos. Entusiasta de la mejora y formación continua.

Deja un comentario