#deltalake – Alb3rto Alonso

Tips de Agosto 2024

Aprovechando que estaba leyendo la documentación de Delta Lake 4.0.0-preview, quiero incidir en lo importante que es conocer los modelos de datos con los que trabajas y el detalle «a punto fino» de los propios procesos ELT que empleas. Principalmente porque con esta visión se podrá evitar más de un conflicto. Por ejemplo cuando concurrenSigue leyendo «Tips de Agosto 2024»

Uniendo capacidades para hacer un traje a medida con Apache XTable y UniForm

Desde hace mucho tiempo se percibe que, los sistemas de ficheros basados en formatos open source como Apache Iceberg, Apache Hudi y Delta Lake, se han convertido en el standard con el que construir tu Data Warehouse corporativo. Al menos asi lo indica el 74% de los CIO a nivel global en recientes encuestas. ConSigue leyendo «Uniendo capacidades para hacer un traje a medida con Apache XTable y UniForm»

La importancia de leer el DAMA-DMBOK, de vez en cuando

Para un profesional del mundo de los datos, disponer del DAMA-DMBOK es imprescindible. Es uno de esos libros de cabecera que debes tener en tu biblioteca y consultar o incluso releer de tarde en tarde. Esta mañana he comenzado a leer el primer capítulo, el de Gestión de Datos y he ido anotando frases sencillas,Sigue leyendo «La importancia de leer el DAMA-DMBOK, de vez en cuando»

Benchmark de procesos de carga en Azure Data Factory

Hoy día los equipo de #Data están continuamente moviendo datos y aunque existen opciones como la virtualización, en muchas ocasiones al menos uno o dos saltos son necesarios. Es por ello, que en la entrada de hoy he decidido hacer cuatro supuestos para que, de un modo sencillo, se pueda comprender las ventajas de unaSigue leyendo «Benchmark de procesos de carga en Azure Data Factory»