Desde hace mucho tiempo se percibe que, los sistemas de ficheros basados en formatos open source como Apache Iceberg, Apache Hudi y Delta Lake, se han convertido en el standard con el que construir tu Data Warehouse corporativo. Al menos asi lo indica el 74% de los CIO a nivel global en recientes encuestas. ConSigue leyendo «Uniendo capacidades para hacer un traje a medida con Apache XTable y UniForm»
Archivo de etiqueta: #Lakehouse
La importancia de leer el DAMA-DMBOK, de vez en cuando
Para un profesional del mundo de los datos, disponer del DAMA-DMBOK es imprescindible. Es uno de esos libros de cabecera que debes tener en tu biblioteca y consultar o incluso releer de tarde en tarde. Esta mañana he comenzado a leer el primer capítulo, el de Gestión de Datos y he ido anotando frases sencillas,Sigue leyendo «La importancia de leer el DAMA-DMBOK, de vez en cuando»
Delta Sharing, un «must» para tu solución de analítica avanzada
Cada vez que avanzo un poco más con Unity Catalog, más me gusta y sobre todo entiendo el motivo por el cual Databricks se está volcando en ello. Si hace unas semanas hablé de la gobernanza y configuración de un metastore, hoy quiero continuar con Delta Sharing que no es otra cosa que un protocoloSigue leyendo «Delta Sharing, un «must» para tu solución de analítica avanzada»
How to extend your Data Security at Lakehouse
As you may already know, Lakehouse is an architecture solution developed by Databricks thanks to the Delta Lake file format and built on top of Data Lake. This new approach to data provides many benefits to data teams, but I’m not going to put the spotlight on them at this time, because I’d like toSigue leyendo «How to extend your Data Security at Lakehouse»
Registra una aplicación con Azure AD y crea un Service Principal para vincular ADLS con Azure Databricks
En este documento realizaré un step by step que describa cómo montar Azure Data Lake Storage Gen2 en Azure Databricks de cara a componer una arquitectura Lakehouse, empecemos. Partimos de un ADLS previamente creado, para ello recordar que, es básico seleccionar la opción de jerarquía. Por lo que, una vez desplegado el recurso, lo siguienteSigue leyendo «Registra una aplicación con Azure AD y crea un Service Principal para vincular ADLS con Azure Databricks»
Comienzo con MLOps y continuo con Lakehouse. ¡Larga vida a Databricks!
Hace unos días obtuve mi primera insignia de Databricks, se trató de la Lakehouse Fundamental. Ciertamente no es complicada de obtener y en este caso además, el examen es gratuito, con lo que si pretendes avanzar en el conocimiento de su stack tecnológico, estás a tiempo. Tan sólo tienes que inscribirte en la Academia deSigue leyendo «Comienzo con MLOps y continuo con Lakehouse. ¡Larga vida a Databricks!»
Pon un Lakehouse en tu vida y eleva las capacidades analíticas de tu compañía al siguiente nivel
Hace unos días asistí a una webinar de Databricks en la que hablaron acerca de cómo integrar los dos mundos de analítica, el tradicional Business Intelligence y la parte más ligada a Machine Learning y la Ciencia de Datos. Como sabemos, si a un experto en Inteligencia de Negocio le preguntas por: Data Warehouse, FactoríaSigue leyendo «Pon un Lakehouse en tu vida y eleva las capacidades analíticas de tu compañía al siguiente nivel»