Las empresas basadas en datosutilizan los catálogos de datospara facilitar la identificación, comprensión y colaboración de los datos. Los catálogos de datos son herramientas esenciales para la administración, la conservación y el gobierno de datos (data governance). Son algo estratégico, muy útiles para la gestión de activos de datos y para mejorar la calidad y la productividad de los análisis.

La razón de ser de estas herramientas es que las bases de datos relacionales y los lagos de datos, entre otras, son potentes para almacenar y actualizar, para consultar, buscar y procesar datos. Sin embargo, no suelen incorporar herramientas o interfaces de usuario para compartir lo que hay en ellas. No ofrecen una manera fácil de evaluar qué hay en ellas desde el exterior.

Es cierto que existenherramientas para extraer metadatos de una base de datos, para producir informes y mucho más, pero tienen ciertas limitaciones que hacen que sean inviables o poco útiles para los requerimientos de una empresa basada en datos. Por ejemplo:

  • Requieren demasiada experiencia técnica y es poco probable que sean utilizadas por usuarios finales que no sean técnicos.
  • Los métodos son demasiado manuales para empresas con múltiples bases de datos de Big data o con nubes híbridas operativas, por ejemplo.
  • Los enfoques no son particularmente útiles para los científicos de datos que desean trabajar, por ejemplo, en experimentos de aprendizaje automático con conjuntos de datos primarios y derivados.
  • La estrategia de auditar metadatos de bases de datos no facilita el Data governance.

Los catálogos de datos vienen a suplir estas carencias o a superar estas limitaciones. Son herramientas colaborativas en torno a las fuentes de datos. Son importantes para las organizaciones con científicos de datos que experimentan con el aprendizaje automático y para las que incorporan análisis en aplicaciones orientadas al cliente.

Los catálogos de datosayudan a responder preguntas como qué datos existen, cómo encontrar las mejores fuentes de datos, cómo protegerlos y quién tiene experiencia con ellos. Suelen incluir herramientas para descubrir fuentes de datos, capturar metadatos de esas fuentes y algunas capacidades de gestión de metadatos.

Un catálogo de datoses más que un directorio estructurado, puesto que incluyen relaciones entre fuentes de datos, entidades y objetos. También incluyen, en su mayoría, herramientas para definir diccionarios de datos. Son, en definitiva, herramientas muy útiles para la actividad de cualquier empresa basada en datos.

Deja tu comentario sobre "¿Qué es un «catálogo de datos»?"

Nos encantará conocer tu opinión, pero primero tenemos que indicarte que los comentarios están moderados, y no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos a los autores, a cualquier otro comentarista o la empresa propietaria de esta página. Estás en tu perfecto derecho de comentar anónimamente, pero por favor, no utilices el anonimato para decirles a las personas cosas que no les dirías en caso de tenerlas delante. Intenta mantener un ambiente agradable en el que las personas puedan comentar sin temor a sentirse insultados o descalificados. No comentes de manera repetitiva sobre un mismo tema, y mucho menos con varias identidades o suplantando a otros comentaristas. También, procura que tus opiniones estén relacionadas con lo que se comenta en esta entrada. Los comentarios off-topic, promocionales, o que incumplan todas estas normas básicas serán eliminados.


Presto mi consentimiento para que, de acuerdo a la normativa europea de protección de datos, T-Systems ITC Iberia S.A.U trate mis datos personales con la finalidad de identificar al autor del comentario previo. Estos datos se pueden ceder a las empresas del grupo Deutsche Telekom AG. Está prevista la realización de transferencias a Francia. Puede ejercer sus derechos de acceso, rectificación, supresión, limitación, oposición y portabilidad de datos solicitándolo por escrito a: T-Systems ITC Iberia SAU, Calle Sancho de Ávila, 110. 08018 Barcelona, o a través de correo electrónico a FMB.TS-IB-PROTEC-DATOS-PERSONALES@t-systems.com, adjuntando en todo caso un documento acreditativo de su identidad. A su vez, puede dirigir cualquier consulta al Delegado de Protección de Datos a la dirección indicada anteriormente.