Tips para adoptar Data Mesh

Todo aquel que siga con atención los cambios que se llevan produciendo en lo últimos años en el ámbito de los datos, sabrá o al menos le sonará el paradigma Data Mesh. En mi blog ya he dedicado varias entradas a hablar de él y en el de hoy, lo que pretendo es sentar algunasSigue leyendo «Tips para adoptar Data Mesh»

Desplegando un mismo Notebook en múltiples Azure Databricks con Azure DevOps

Hay ocasiones en las que queremos extender las capacidades de un Notebook de Jupyter desarrollado sobre Visual Code a través de un repositorio de Azure DevOps a más de un Azure Databricks Workspace. Esto guarda relación con la puesta en funcionamiento del concepto Data Mesh, pues si en este ejemplo, el Notebook contuviera un procesoSigue leyendo «Desplegando un mismo Notebook en múltiples Azure Databricks con Azure DevOps»

Aplica Cluster Policies en Azure Databricks y evita sustos

Azure Databricks en uno de los principales componentes en desarrollos de Analítica Avanzada y como pieza clave, ofrece la posibilidad de configurarse al gusto de cada uno. Algo que en entornos empresariales puede conllevar ineficiencias y sobrecostes. Con respeto al segundo punto, sólo hace falta echar un vistazo al presupuesto de abajo para entender loSigue leyendo «Aplica Cluster Policies en Azure Databricks y evita sustos»

Registra una aplicación con Azure AD y crea un Service Principal para vincular ADLS con Azure Databricks

En este documento realizaré un step by step que describa cómo montar Azure Data Lake Storage Gen2 en Azure Databricks de cara a componer una arquitectura Lakehouse, empecemos. Partimos de un ADLS previamente creado, para ello recordar que, es básico seleccionar la opción de jerarquía. Por lo que, una vez desplegado el recurso, lo siguienteSigue leyendo «Registra una aplicación con Azure AD y crea un Service Principal para vincular ADLS con Azure Databricks»

Azure Data Lake como solución eficiente, para el almacenamiento de datos

El almacenamiento eficiente de datos es una de las piezas clave a la hora de dibujar la estrategia de tu organización, y soluciones como Azure Data Lake te permiten cumplir con las actuales recomendaciones de buenas prácticas en cuanto a arquitectura de datos. Para este caso de negocio, voy a necesitar un conjunto limitado deSigue leyendo «Azure Data Lake como solución eficiente, para el almacenamiento de datos»

Azure Synapse Pathway o cómo migrar fácilmente tu Data Warehouse

Hace una semana escribí acerca de un buen conjunto de novedades de Azure Synapse, aquí. Si bien, la fiesta continua y hoy os presento una solución en preview que viene a hacer la vida más fácil a las organizaciones que quieren modernizar sus almacenes de datos moviéndolos al Cloud de Microsoft y sobre todo, dotándolosSigue leyendo «Azure Synapse Pathway o cómo migrar fácilmente tu Data Warehouse»

Novedades en Azure Synapse, el multiusos de Microsoft

Si la semana pasada pude asistir al Microsoft Cloud Data Summit, hoy he tenido la oportunidad de ver un especial sobre Azure Synapse titulado «Build an Unified Analytics Platform with Azure Synapse and Power BI«. La sesión estaba grabada previamente, con lo que he podido aprovechar el rato de la comida para empaparme de susSigue leyendo «Novedades en Azure Synapse, el multiusos de Microsoft»

¡Agenda completa! Esto es un no parar de eventos, meetups, charlas y demás.

Abril se ha marchado y comienza un Mayo llenito de nuevos desafíos, pero antes de hablar de los que vienen, haré un repaso de los que sucedieron el mes pasado, donde el más destacado fue el sucedido el pasado jueves 28 de abril. Primer evento en directo de mi nuevo grupo de Meetup, «Encuentros enSigue leyendo «¡Agenda completa! Esto es un no parar de eventos, meetups, charlas y demás.»

Replicando el Data Pipeline de Zendesk desde AWS a Azure, parte I

Hace unos días leí el caso de éxito de arquitectura de datos de la empresa Zendesk sobre AWS y decidí hacer un ejercicio de revisión y adaptación del mismo en Azure. En esta primera entrada, el scope es el relativo a la para del Data Lake Pipeline marcado en rojo. Lo primero es crear losSigue leyendo «Replicando el Data Pipeline de Zendesk desde AWS a Azure, parte I»

¡Bendita condena la mía!

Suelo repetir habitualmente que es una buena práctica enfrentar desafíos para continuar mejorándote. En mi caso, tengo la suerte de disponer de esa inercia que me «obliga» a no rechazar ningún reto. La semana pasada por ejemplo, durante algún que otro rato libre, estuve analizando el pipeline de procesamiento de datos batch del caso deSigue leyendo «¡Bendita condena la mía!»