#Databricks – Alb3rto Alonso

Espacio de datos más allá de Snowflake

En las dos pasadas entradas de mi blog, me he centrado en Secure Data Sharing, pero principalmente con Snowflake com pieza clave, tanto a nivel productor como consumidor. En esta neva entrada, amplío el horizonte hacia otras fórmulas para construir tu Espacio de Datos. 1. Comprender las opciones: acceso interno vs. externo El objetivo esSigue leyendo «Espacio de datos más allá de Snowflake»

Cuando el dato sale del BI: observabilidad, seguridad y el nuevo campo de batalla de las plataformas de datos

Durante años, las plataformas de datos han competido principalmente en un terreno bien conocido: analítica, BI, ingeniería de datos y machine learning. Sin embargo, en los últimos meses estamos viendo un movimiento mucho más profundo y revelador. Tanto Snowflake como Databricks están expandiendo su propuesta hacia un nuevo espacio:👉 los datos operacionales, la telemetría ySigue leyendo «Cuando el dato sale del BI: observabilidad, seguridad y el nuevo campo de batalla de las plataformas de datos»

Integrando (SAP), que es gerundio

Con la evolución de las plataformas de datos y la explosión de la Inteligencia Artificial son pocos los propietarios de dominios de datos que no quieran aprovechar todas estas nuevas capacidades para generar Insights y ofrecer más valor a negocio. Esa es la teoría, la práctica en ocasiones se complica. El ejemplo que ilustra laSigue leyendo «Integrando (SAP), que es gerundio»

Unity Catalog y sus schemas «chivatos»

Hace tiempo hablé acerca de la importancia de controlar las principales métricas de desempeño de los clústers de Databricks. Sobre todo, si quieres habilitar una estrategia FinOps con el propósito de optimizar tus procesos de analítica avanzada en la nube. Pues en esa ocasión, hablé acerca la librería Overwatch. Se trata de una librería queSigue leyendo «Unity Catalog y sus schemas «chivatos»»

La importancia de leer el DAMA-DMBOK, de vez en cuando

Para un profesional del mundo de los datos, disponer del DAMA-DMBOK es imprescindible. Es uno de esos libros de cabecera que debes tener en tu biblioteca y consultar o incluso releer de tarde en tarde. Esta mañana he comenzado a leer el primer capítulo, el de Gestión de Datos y he ido anotando frases sencillas,Sigue leyendo «La importancia de leer el DAMA-DMBOK, de vez en cuando»

Comunidades, ese divino tesoro

Dicen que «de bien nacido es ser agradecido», pues de eso va esta entrada, de dar las gracias a Toni Granell por pensar en mi como parte del staff de la Global Communities: AI & Low Code. Toni y yo venimos colaborando desde hace ya un par de años gracias a LinkedIn. Esa red queSigue leyendo «Comunidades, ese divino tesoro»

La evolución del data sharing

Van pasando los años y las organizaciones, al igual que nos sucede a nosotros, maduran con el tiempo. Normalmente, con la madurez adquirimos mayor de mayor autoconocimiento, autocontrol, nos volvemos algo más reflexivos. En definitiva, nos acercamos a lo que los antiguos llaman la «sabiduría». Pues algo similar les ocurre a las organizaciones. Muchas deSigue leyendo «La evolución del data sharing»

Fabric, el todo en uno de Microsoft

Hace tan sólo unas semanas que se lanzó la solución de datos integral de Microsoft y digo «solución» porque se trata de un SaaS. Con Fabric las organizaciones se pueden ir olvidando de la infraestructura, ni tan siquiera como código. Hay que decir adiós a Terraform, ARM, Bíceps,… y quizás, también irnos despidiendo de nuestrosSigue leyendo «Fabric, el todo en uno de Microsoft»

Delta Sharing, un «must» para tu solución de analítica avanzada

Cada vez que avanzo un poco más con Unity Catalog, más me gusta y sobre todo entiendo el motivo por el cual Databricks se está volcando en ello. Si hace unas semanas hablé de la gobernanza y configuración de un metastore, hoy quiero continuar con Delta Sharing que no es otra cosa que un protocoloSigue leyendo «Delta Sharing, un «must» para tu solución de analítica avanzada»

Data Contracts para una «descentralización comprometida»

Si hace un par de semanas pude participar en un Hands-on con Fivetran y DBT, la semana pasada he podido asistir a una sesión con Piethein Strengholt, actual CDO de Microsoft en Holanda, donde nos ha presentado su particular visión acerca de Data Contracts en arquitecturas de datos distribuidas. Como ya he comentado en másSigue leyendo «Data Contracts para una «descentralización comprometida»»