
«Sin datos, sólo eres una persona con otra opinión». W. Edwards Deming
Ultimas entradas
Data Contracts para una «descentralización comprometida»
Si hace un par de semanas pude participar en un Hands-on con Fivetran y DBT, la semana pasada he podido asistir a una sesión con Piethein Strengholt, actual CDO de Microsoft en Holanda, donde nos ha presentado su particular visión acerca de Data Contracts en arquitecturas de datos distribuidas. Como ya he comentado en más…
¡Quien rompe paga!
La frase que da título a la entrada era muy frecuente en mis tiempo mozos,… o al menos así la recuerdo y justo fruto de estas warning quizás sea por lo que muchas personas no suelen arriesgarse a salir de la zona de confort. No sea que la líe y encima tenga que soltar unos…
Puntos a tener en cuenta a la hora de definir tu estrategia Data Driven
En más de una ocasión, las organizaciones se focalizan en la tecnología a la hora de elegir la mejor estrategia de datos y por supuesto que la tecnología es importante, si bien es mejor poner el foco en un análisis profundo de los procesos y de las personas. Conocer en profundidad el ciclo de vida…
«En Abril, aguas mil», esperemos que esta vez se quede en outlier
En este mes de abril he tenido la suerte de participar en varios eventos alrededor del dato, conocer y conectar con gente fabulosa (de la que estoy seguro me aportarán mucho en el futuro). Además, he realizado un nuevo directo de mi grupo de Meetup «Encuentros en la Tercera Fase» (y ya vamos por catorce),…
Data Driven Day 2023, Insights
Si hace un par de semanas estuve en el Lakehouse Day, el pasado jueves tuve la oportunidad de asistir al Data Driven Day 2023 en Madrid organizado por iKN Spain y es por ello que quiero aprovechar para escribir acerca de los puntos clave que saqué del evento. Del Lakehouse Day destaqué el «simple, open…
Veto a ChatGPT, ¿estamos locos?
Hace unos días saltó la noticia acerca de que Italia iba a prohibir el uso de ChatGPT por presuntos problemas con respecto a la normativa GDPR, y como no, el contagio a otros países del viejo continente cabía esperarse. Pues así fue, España también se está planteando el veto a la solución tecnológica del momento.…
Data Linaje con Unity Catalog de Databricks
Como ya mencioné en la anterior entrada, donde hice un breve resumen del Lakehouse Day de Databricks en Madrid, la incorporación de Unity Catalog suma y mucho a la hora de tomar la decisión sobre cual es la mejor herramienta con la que construir la solución de datos corporativa. Del mismo modo mencioné que, para…
Simple, Open Source y Multicloud
Hace unas semanas estuve en el Lakehouse de Databricks que se celebró en Madrid y entre las muchas cosas que aprendí, me quedo con la frase del título. Haz las cosas de un modo Simple, apuesta por proyectos Open Source y si puedes, sé Multicloud. Estos tres aspectos se mencionaron en multitud de ocasiones durante…
Unity Catalog en Azure Databricks: gobernando el Lakehouse
En la primera entrada de Unity Catalog describí brevemente qué es Unity Catalog para saltar a la configuración de nuestro primer Metastore. Ahora, vamos a profundizar en los aspecto de gobernanza, comenzando por la creación de grupos. Como el primer schema que creamos es production, vamos a crear un grupo específico para ese schema. ¡Veamos!…
Unity Catalog en Azure Databricks: creando nuestro primer metastore
Hace tiempo que tenía ganas de hacer un artículo acerca de Unity Catalog profundizando en elementos como Metastore, Catalog, Schema,… Databricks a día de hoy es una de las piezas clave en el desarrollo de soluciones de Analítica Avanzada y justo por eso es por lo que este artículo cobra especial valor. Desde que hace…
¡Cosas chulas que llegan!
En este primer trimestre de 2023 me están sucediendo muchas «cosas» chulas y hay ocasiones en las que no sabes si se debe a la casualidad o si por contra, se debe a todo el trabajo que hay por detrás. Sea como sea, en estos días toca recoger 😉 Pues entre esas «cosas» chulas, la…
A veces, parece que «alguien» nos hace un guiño
La verdad es que no sé por donde empezar., así que comenzaré relatando lo que sucedió el pasado lunes 13 de febrero. Eran cerca de las cuatro y media de la tarde y me encontraba en una sala de actividades de una Residencia para Personas Mayores de la localidad de Alcobendas. Estaba allí porque iba…
Change Data Capture en Azure SQL Database y Azure Data Factory
Azure SQL Database Change Data Capture o CDC es una capacidad que permite a los sistema de bases de datos (SQL y NoSQL) como Azure SQL Database capturar aquellos registros que han sufrido modificaciones (lo que son inserciones, borrados y actualizaciones). Dicha cualidad se apoya en elementos como la metadata y tablas de control de…
Cómo usar Try-Catch en Databricks SQL Notebooks
El control de los procesos es una buena práctica de datos ya que te permite identificar aquellos posibles puntos de fallo en tus scripts durante el tiempo de ejecución. Sin embargo, para los que habitualmente se pegan con los Notebooks de SQL en Databricks, vemos que no es posible incluir bloques de captura de errores…
Dispara tus pipelines de Azure Data Factory mediante eventos
Azure Data Factory hace tiempo que dejó de ser una simple ETL para convertirse en un genial orquestador de procesos de datos. Es más, para mi que he tenido la oportunidad de trabajar con multitud de herramientas similares, creo que Data Factory hoy en día está, sin duda, en el top 3. Uno de los…
A veces, no es aconsejable mezclar peras con manzanas
Esta semana, tratando de crear un pipeline de Azure Data Factory que ejecuta una actividad de Azure Databricks, que levanta un clúster pasando un conjunto de parámetros para la configuración y, además, utilizando el fichero dh-init.sh para completar la instalación de un conjunto de librerías desde la zona de configuración avanzada, he sufrido un montón…
Probando un ordenador con ruedas
No son ni las cinco de la mañana y tengo los ojos como platos. Desde pequeño me viene pasando que, si al día siguiente tengo algún plan genial, no soy capaz de dormir. Así que no me ha quedado otra que levantarme y ponerme a escribir esta entrada para, al menos, aprovechar que estoy en…
Mis amigos «digitales», de conectar a conocer y colaborar
Fue a raíz de la pandemia cuando el uso de herramientas como Skype, Teams, Zoom y otras, saltó desde el mundo empresarial al personal. Así que, durante esos meses era frecuente encontrarte tomando un café virtual con tus amigos alguna tarde que otra del fin de semana, mientras que sufrías por no montar conversaciones paralelas…
Que el vértigo no te bloquee
Uno de los deportes que más me gusta practicar es el montañismo. Comencé con él cuando estuve viviendo en la zona del Moncayo, más concretamente en el lado soriano del mismo. Desde entonces formo parte del Club de Montaña Cima 2.000 Moncayo. Comencé con ellos haciendo trekking y poco a poco fui incrementando los metros…
A disfrutar (mi eslogan para 2023)
Hoy 26 de diciembre encuentro el primer hueco para poder escribir unas líneas. Estos días son de lo más movido y disponer de un ratito para concentrarte y ponerte delante del procesador de texto, resulta de lo más difícil. Ahora, una vez conseguido, espero no tener ninguna interrupción y conseguir terminar el artículo a tiempo…
La Santísima Trinidad
Mucho estoy escuchando hablar sobre lo cerca que estamos para la llegada de la Inteligencia Artificial General. Estos días es imposible no leer tweets y post en LinkedIn,… acerca de ChatGPT. Si bien es interesante, para mi hay un trinomio que de verdad me genera «preocupación»: Metaverso, Computación Cuántica y Superinteligencia Artificial (SIA). Pensar en…
Quemando el 2022 y preparando el próximo
Son las 6:30 de la mañana del sábado 3 de diciembre y ya tengo a Molly (Golden de 2 años y medio) mirándome fijamente para que comience nuestro ritual vespertino. Se trata de bajar, hacerme un café y darles un palito de Dentastix mientras que me preparo para dar el paseo matutino. Django (mestizo de…
Seguimos sumando gracias a gente como tú
Hace ya un par de años que decidí a alojar el contenido que de forma habitual iba creando, en mi blog personal. En ese momento, me decanté por el plan personal de WordPress ya que, parecía la forma más sencilla de disponer de un lugar donde gestionar las entradas y dotar al blog de un…
Los cuatro principios de Data Mesh: Datos como producto
Para quien, todavía no esté al tanto de lo que representa Data Mesh, decir que se trata de un nuevo paradigma que busca principalmente descentralizar la gestión de los Datos. Para ello se construye sobre cuatro pilares básicos que son: En esta ocasión no voy a comenzar por el primero de los pilares que aparece…
Si quieres recibir mis últimas publicaciones directamente.