Azure Data Factory es un muy buen orquestador como ya venimos viendo desde hace tiempo. Son muchas las entradas donde a lo largo de estos años he hablado acerca de él, por lo que hoy vamos a sumar un nuevo artículo al conjunto. En esta ocasión quiero describir cómo configurar la actividad de copia, siendoSigue leyendo «Copy Activity de ADF para Delta Lake»
Archivo del autor: alb3rtoalonso
Pon siempre un identificador en tus tablas y a ser posible que sea PK
Que el propietario del dominio tenga cada vez más peso en las nuevas aproximaciones de datos como Data Mesh está genial porque él mismo comienza a «sufrir», en primera persona, los errores de diseño de sus tablas transaccionales al moverse del operacional a la analítica. Suele suceder que, en la mayor parte de soluciones deSigue leyendo «Pon siempre un identificador en tus tablas y a ser posible que sea PK»
Fabric, el todo en uno de Microsoft
Hace tan sólo unas semanas que se lanzó la solución de datos integral de Microsoft y digo «solución» porque se trata de un SaaS. Con Fabric las organizaciones se pueden ir olvidando de la infraestructura, ni tan siquiera como código. Hay que decir adiós a Terraform, ARM, Bíceps,… y quizás, también irnos despidiendo de nuestrosSigue leyendo «Fabric, el todo en uno de Microsoft»
Cómo usar el Filtro en Azure Data Factory
Desde hace tiempo vengo escribiendo acerca de Azure Databricks, pero en esta ocasión voy a escribir un breve artículo acerca de cómo emplear la actividad de filtro en un pipeline de datos de Azure Data Factory. Son muchas la ocasiones en las que debemos realizar diferentes ajustes en los flujos de datos y por ello,Sigue leyendo «Cómo usar el Filtro en Azure Data Factory»
Delta Sharing, un «must» para tu solución de analítica avanzada
Cada vez que avanzo un poco más con Unity Catalog, más me gusta y sobre todo entiendo el motivo por el cual Databricks se está volcando en ello. Si hace unas semanas hablé de la gobernanza y configuración de un metastore, hoy quiero continuar con Delta Sharing que no es otra cosa que un protocoloSigue leyendo «Delta Sharing, un «must» para tu solución de analítica avanzada»
Evolución automática del Schema de datos, ¿sí o no?
El Schema de los datos es la parte de la metadata donde se identifican las características de cada uno de los campos que forman parte de una entidad. El ejemplo más claro lo tenemos en la columna de una tabla de la base de datos. En este caso, podemos encontrar campos del tipo cadena, numérico,Sigue leyendo «Evolución automática del Schema de datos, ¿sí o no?»
Data Contracts para una «descentralización comprometida»
Si hace un par de semanas pude participar en un Hands-on con Fivetran y DBT, la semana pasada he podido asistir a una sesión con Piethein Strengholt, actual CDO de Microsoft en Holanda, donde nos ha presentado su particular visión acerca de Data Contracts en arquitecturas de datos distribuidas. Como ya he comentado en másSigue leyendo «Data Contracts para una «descentralización comprometida»»
¡Quien rompe paga!
La frase que da título a la entrada era muy frecuente en mis tiempo mozos,… o al menos así la recuerdo y justo fruto de estas warning quizás sea por lo que muchas personas no suelen arriesgarse a salir de la zona de confort. No sea que la líe y encima tenga que soltar unosSigue leyendo «¡Quien rompe paga!»
Puntos a tener en cuenta a la hora de definir tu estrategia Data Driven
En más de una ocasión, las organizaciones se focalizan en la tecnología a la hora de elegir la mejor estrategia de datos y por supuesto que la tecnología es importante, si bien es mejor poner el foco en un análisis profundo de los procesos y de las personas. Conocer en profundidad el ciclo de vidaSigue leyendo «Puntos a tener en cuenta a la hora de definir tu estrategia Data Driven»
«En Abril, aguas mil», esperemos que esta vez se quede en outlier
En este mes de abril he tenido la suerte de participar en varios eventos alrededor del dato, conocer y conectar con gente fabulosa (de la que estoy seguro me aportarán mucho en el futuro). Además, he realizado un nuevo directo de mi grupo de Meetup «Encuentros en la Tercera Fase» (y ya vamos por catorce),Sigue leyendo ««En Abril, aguas mil», esperemos que esta vez se quede en outlier»