Cada vez que avanzo un poco más con Unity Catalog, más me gusta y sobre todo entiendo el motivo por el cual Databricks se está volcando en ello. Si hace unas semanas hablé de la gobernanza y configuración de un metastore, hoy quiero continuar con Delta Sharing que no es otra cosa que un protocolo Open Source para la compartición de datos, ya sea entre departamentos de una misma organización, como con externos.
Si bien, según e ido configurando el caso, me he dado cuenta de que puede ser incluso una manera de acceder a la información empresarial sin necesidad de tener un clúster levantado o incluso hacer uso del SQL Serverless. Es decir, nos permite consumir datos simplemente sin incurrir en costes adicionales. Ciertamente, limita capacidades propias de Databricks respecto de la seguridad, pero si, como en este ejercicio, el consumidor es un informe de Power Bi, quizás se pueda aplicar el conjunto de políticas de seguridad desde la herramienta y así nivelar la balanza. En breve echaré un vistazo a este punto de la seguridad, para confirmar que sigue siendo una aproximación interesante incluso para entornos productivos y con información confidencial / sensible.
Bueno, pues comienzo con el step-by-step de cómo configurar Delta Sharing para consumir datos desde Microsoft Power Bi
Delta Sharing
Lo primero es acceder a la pestaña de Data Explorer del Databricks Workspace y acto seguido ir a la sección de «Shared by me». Aquí debemos pulsar sobre el botón «New recipient» y nos aparecerá el pop-up de abajo. En nuestro caso, sirve incluirle un nombre y el comentario. No hace falta indicar el identificador porque no será consumido por otro Databricks Workspace.
NOTA: Aquí quiero entender porqué Unity te permite compartir la información con los distintos Workspaces, tanto compartiendo a través del catálogo como usando Delta Sharing. Seguro que hay diferencias que pueden hacer que te decantes por con un caso de uso u otro. ¡Interesante!

Pues una vez tenemos nuestro recipiente, nos aparece un pantalla con un link de activación del componente recién creado. Debes pegar esa url en tu navegador para acceder a la página de activación.

Una vez accedes a esa página, debes descargar la credencial de conexión y recuerda, esta descarga sólo se puede realizar en una ocasión, con lo que guarda bien protegida esa información

Volviendo a nuestro recipiente, tras descargar la credencial, vemos que nos informa que se encuentra activado. Por cierto, comentar que el fichero de la credencial se puede abrir perfectamente con Visual Code y que dispone de una url y de un token que posteriormente deberás utilizar en Microsoft Power Bi.

El siguiente paso es crear un espacio de compartición. Esto se realiza pulsando sobre el botón «Share data». En ese momento aparecerá el pop-up de abajo y al igual que en el caso del recipiente, nos sirve con poner el nombre.

Creado el espacio de compartición, hay que ligarlo al recipiente desde el que compartir los datos. Como sólo tenemos uno creado, es sencillo. Este en un buen punto para previamente haber definido una «naming convention» que nos haga la vida más sencilla 😉

Ya lo tenemos todo configurado, con lo que tan sólo nos quedaría incluir los recursos a compartir.

Mediante el botón de «Manage assets» incorporamos todas las tablas de los distintos catálogos que queramos compartir con terceros.

Power Bi
Ya hemos finalizado la parte de configuración del recipiente, hemos descargado la credencial para la conexión, incorporado los recursos de datos en el espacio de compartición, con lo que tan sólo resta explotar la información desde Power Bi. ¡Veamos!
Lo primero es pulsar sobre obtener datos y seleccionar «Otras» fuentes. Haciendo un poco de «scroll down» aparece Delta Sharing, con lo que pulsamos.

En la primera pantalla de configuración de la fuente debemos incluir la url presente en la credencial previamente descargada y pulsar aceptar.

Y en la siguiente, tan sólo debemos incluir el token presente en el mismo fichero de credencial y pulsar conectar

Seleccionamos los elementos que queramos desde nuestra fuente

Y componemos nuestro informe… como cualquier otro
CONCLUSIÓN
Hace unos días en el evento de DAMA España en Madrid tuve la oportunidad de charlar con varios de los invitados acerca del «momento dulce» que está viviendo el mundo de los datos. Si bien, esto obliga a estar muy pendiente y «jugar mucho» con las continuas novedades y actualizaciones que los proveedores de tecnología ofrecen. Pero siempre sin perder el norte, pues se puede llegar a perder cierta perspectiva y despistarnos de lo que realmente genera valor a negocio.
Me encanta la tecnología y más aún «cacharrear», por lo que espero que te haya gustado la entrada y te permita entender los posibles beneficios que aporta una solución como Delta Sharing a tu negocio.
Si te gusta este tipo de contenido recuerda que además puedes seguir al grupo de Meetup de «Encuentros en la Tercera Fase» donde invitamos a auténticos cracks que nos cuentan sus experiencias, opiniones, puntos de vista,… gracias a ellos aprendemos muchísimo de casos reales. Por eso, no dudes en unirte y ayudarnos a seguir creando COMUNIDAD, gracias.