La importancia de leer el DAMA-DMBOK, de vez en cuando

Para un profesional del mundo de los datos, disponer del DAMA-DMBOK es imprescindible. Es uno de esos libros de cabecera que debes tener en tu biblioteca y consultar o incluso releer de tarde en tarde.

Esta mañana he comenzado a leer el primer capítulo, el de Gestión de Datos y he ido anotando frases sencillas, pero que expresan justamente lo que los datos representan para las organizaciones a día de hoy.

En todas las charlas, tertulias, meetups, eventos,.. se habla siempre del dato como activo, escuchamos que «es el nuevo petróleo», nos hablan de la necesidad de encontrar ventajas competitivas gracias a su explotación,… Sin embargo, me da la sensación de que, en los últimos tiempos, se ha perdido un poco el foco y nos movemos a golpe de hype.

Si nos paramos un momento y nos elevamos por encima del bosque, podemos observar que además de GenAI (que es para un capítulo a parte), existen constantes lanzamientos de componentes, soluciones, elementos, capacidades,… de los diferentes players en el ecosistema del dato. Esto hace que las organizaciones se sientan confundidas y no sepan exactamente cómo articular una correcta estrategia. ¡Se están atragantando!

Da la sensación de que hay demasiado ruido alrededor

Desde aquí (y tras leer de nuevo el capítulo) quiero escribir un par de frases del propio libro, donde creo que aterriza muy ilustrativamente la solución a toda esta vorágine tecnológica. Aquí va: «Los requerimientos de datos deben guiar las decisiones de tecnología de la información. Es decir, los requerimientos de Gestión de Datos son Requerimiento de Negocio«. Y otro que aún lo clarifica mucho más: «La gestión de datos requiere un enfoque que asegure que la tecnología sirve, en lugar de dirigir, a las necesidades estratégicas de datos de una organización«.

En mi caso, llevo muchos años trabajando en el ámbito de los datos y he visto (y algunas veces sufrido) estrategias de gestión de los datos dirigidas por la tecnología. Lo que significaba en casi el 100% de los casos, un retorno inexistente de valor a la organización. Más bien al contrario, se transformaban en auténticos pozos sin fondo, genuinas máquina de quemar dinero. Por eso, antes de abrazar la última tecnología, porque toque, trata de involucrar a los diferentes equipos, que negocio realmente identifique los casos de uso y tras un periodo de revisión de alternativas, se planifique el roadmap apropiado.

Cierro con otra frase del primer capítulo para mostrar la correcta dirección para tener éxito en los proyectos empresariales de datos: «Ser Data-Driven incluye el reconocimiento de que los datos deben ser gestionados eficientemente y con disciplina profesional, a través de una asociación entre liderazgo empresarial y la experiencia técnica«.

En la actualidad existen multitud de soluciones sobre la que dar forma a la estrategia corporativa de gestión del dato. Así por ejemplo, tenemos soluciones tipo SaaS como Microsoft Fabric para rápidos quick-wins, sobre todo en casos donde el stack tecnológico empresarial viva en el mundo Microsoft y soluciones más complejas donde se requieren equipos multidisciplinares y tienen como core herramientas como Azure Synapse. Snowflake, Databricks y BigQuery.

Con Snowflake, puedes moverte hacia una estrategia de Modern Data Warehouse que permite combinar las bondades de un Data Lake y un Data Warehouse, sabiendo que es ideal para Analistas de Datos y roles más tradicionales de Business Intelligence.

Mientras que con Azure Synapse y Databricks, la estrategia te dirige hacia el Lakehouse, que al igual que sucede con el ejemplo anterior, permite combinar las bondades de un Data Lake y un Data Warehouse gracias al empleo del formato del ficheros Delta Lake, pero además, permite abrir el abanico a roles de usuarios a Ingeniero de Datos, Ingenieros de ML y Científicos de Datos. Todo ello gracias a que los Workspaces emplean como pieza base Apache Spark.

El caso de BigQuery es especial en si mismo y en próximas entradas trataré de explicar en detalle cómo Google está logrando construir un excelente producto sin hacer demasiado ruido.

Y por supuesto, otras muchas alternativas que se pueden construir acoplando diferentes piezas que permitan dar respuesta a tus requerimientos de negocio.

Foto de portada gracias a Pineapple Supply Co.: https://www.pexels.com/es-es/foto/pinas-rosadas-blancas-y-azules-1501299/

Publicado por alb3rtoalonso

Soy un enamorado del poder de los datos. Entusiasta de la mejora y formación continua.

Un comentario en “La importancia de leer el DAMA-DMBOK, de vez en cuando

Deja un comentario