Data Mart – Visión general, justificación de la creación, tipos, estructuras

Qué es un mercado de datos?

Un data mart es una capa de acceso de un almacén de datos centrada en una línea de negocio, función o departamento específico. Se utiliza para recuperar datos orientados al cliente. Un data mart contiene un subconjunto de los datos almacenados en un almacén de datosData WarehouseUn almacén de datos (a menudo abreviado como DW o DWH) es un repositorio central de datos utilizado para la elaboración de informes y el análisis de datos..

Los almacenes de datos son instalaciones de almacenamiento de datos en toda la empresa. La obtención de capas de acceso al mercado de datos orientadas a una única área organizativa específica permite a los usuarios de los departamentos/áreas funcionales acceder a sus datos de forma rápida, sencilla y sin esfuerzo.

Un data mart también puede describirse como un almacén de datos compacto. Por lo tanto, en una organización, las áreas funcionales como finanzas, recursos humanos, marketing, etc., Todos pueden disponer de sus propios mercados de datos que forman parte de un almacén de datos administrado a nivel de la oficina central.

Data Mart frente a. Almacén de datos

Los marts de datos contienen un subconjunto de la información de un almacén de datos. Por esta razón, los marts de datos ofrecen una mayor velocidad de consulta para los analistas, ya que naturalmente contienen menos datos.

El tamaño de un data mart variará dentro de cada área funcional, ya que algunos data marts requieren un almacenamiento considerable. Los data marts son formatos de sólo lectura con actualizaciones controladas realizadas sólo por personal autorizado.

Tipos de Data Marts

Hay tres tipos principales de almacenes de datos. La diferencia entre ellos viene determinada por su relación con el almacén de datos y las fuentes de datos utilizadas para crearlos. Incluyen los marts de datos dependientes, independientes e híbridos.

1. Marts de datos dependientes

Los mercados de datos dependientes se crean utilizando un subconjunto de datos de un almacén de datos existente. Es una estructura descendente en la que todos los datos de la empresa se almacenan en una ubicación central.

Los data marts dependientes dependen de la información extraída de los almacenes de datos de la empresa. El nivel más bajo de datos en un almacén de datos empresarial se denomina datos granulares y actúa como único punto de referencia de todos los marts de datos dependientes creados.

El proceso de extracción consiste en reestructurar los datos del almacén de la empresa y cargarlos en el data mart solicitante para su consulta. El proceso utiliza una vista lógica, que es una tabla virtual no separada físicamente del almacén o un subconjunto físico. Los datos extraídos son una base de datos físicamente distinta del almacén de datos de la empresa.

2. Marts de datos independientes

Los data marts independientes son sistemas autónomos que no están afiliados a los almacenes de datos. Los datos se extraen de fuentes internas o externas y se cargan en el repositorio independiente del data mart para utilizarlos en el análisis cuando sea necesario. Este tipo de mercados de datos se centran en una función o área de negocio concreta.

Los mercados de datos independientes son adecuados para las pequeñas empresasPequeñas y medianas empresas (PYMES)Las PYMES, o pequeñas y medianas empresas, se definen de forma diferente en todo el mundo. El país en el que opera una empresa los proporciona, ya que son fáciles de configurar. Sin embargo, a medida que la empresa crece, puede resultar compleja su gestión mediante la asignación de una herramienta ETL y una lógica correspondientes para cada sistema.

3. Mercados de datos híbridos

Los mercados de datos híbridos combinan fuentes de datos primarios de un almacén de datos existente y otras fuentes de datos externas. El estilo de cohesión del data mart híbrido se beneficia del enfoque descendente centrado en la velocidad y en el usuario final y del enfoque ascendente de la integración a nivel empresarial del data mart independiente.

Estructuras de los mercados de datos

Una estructura de data mart es una base de datos relacional orientada a temasBase de datosUna base de datos se refiere a una colección de información relacionada lógicamente y organizada para que pueda ser fácilmente accesible, gestionada y actualizada. que almacena los datos en tablas, i.e., filas y columnas más fáciles de acceder, organizar y comprender. Los campos de datos pueden referirse a uno o varios objetos.

Los marts de datos están estructurados en un esquema multidimensional que funciona como un esquema para el análisis de datos por parte de los usuarios de la base de datos. Las tres principales estructuras o esquemas para los mercados de datos son la estrella, el copo de nieve y la bóveda.

1. Estrella

El esquema de estrella es un plano que se asemeja a una forma de estrella y consiste en tablas de hechos que hacen referencia a tablas de dimensiones en una base de datos relacional. La tabla de hechos se sitúa en el centro de la estrella y relaciona un conjunto de métricas que se refieren a un proceso específico.

El esquema en estrella requiere menos uniones a la hora de escribir consultas, ya que no hay dependencia entre las tablas de dimensiones. El proceso de solicitud de ETL lo hace enormemente eficiente para acceder y navegar por grandes conjuntos de datos. Dichas ventajas hacen que los esquemas en estrella sean ampliamente utilizados en la mayoría de los sistemas informáticos.

2. Copo de nieve

Un esquema de copo de nieve amplía el esquema de estrella con tablas de dimensiones adicionales que se normalizan para proteger la integridad de los datos y minimizar la redundancia de los mismos. El esquema de copo de nieve’La principal ventaja de Star es que requiere menos espacio de almacenamiento para las tablas de dimensiones.

Sin embargo, una estructura de copo de nieve es difícil de mantener debido a las múltiples tablas que hay que rellenar y sincronizar. También repercute negativamente en el rendimiento como resultado de la necesidad de tablas de dimensiones adicionales.

3. Bóveda

El esquema de bóveda permite a los usuarios diseñar almacenes de datos empresariales ágiles. Es una técnica de modelado de bases de datos bastante moderna. El esquema de la bóveda es una estructura en capas que se centra en la agilidad y la escalabilidadLa escalabilidad puede entrar en contextos tanto financieros como de estrategia empresarial. En ambos casos, representa la capacidad de la entidad para soportar la presión.

Justificación de la creación del data mart

    Usos de los Data Marts

      Data Mart y computación en nube

      El aumento de los big dataBig Data en finanzasLos big data en finanzas se refieren a conjuntos de datos grandes, diversos (estructurados y no estructurados) y complejos que ayudan a proporcionar soluciones a retos empresariales de larga duración en las empresas está poniendo el futuro del almacenamiento de datos en la computación en nube. A medida que más almacenes de datos se trasladen a la nube, también lo harán los mercados de datos. La computación en la nube les da acceso a datos rápidamente escalables.

      Las plataformas basadas en la nube pueden facilitar la consolidación de todos los datos en un solo repositorio donde estarán contenidos todos los data marts. Proporcionan un almacenamiento eficaz, un acceso fácil en tiempo real y un análisis de datos eficiente, así como un ahorro de costes. Las tecnologías modernas pueden separar el almacenamiento de datos de la computación, lo que permite la máxima escalabilidad para la consulta de datos.

      Las plataformas de almacenamiento basadas en la nube permiten el almacenamiento de grandes conjuntos de datos y también permiten un acceso y análisis de la información fácil y eficiente. Además, permiten crear y compartir datos sin problemas. Las plataformas de almacenamiento basadas en la nube pueden crecer de forma sostenible a medida que los conjuntos de datos se hacen más grandes. Se pueden crear estructuras de datos transitorias y a largo plazo para permitir el análisis a corto y largo plazo.

      A continuación se exponen algunas de las ventajas de los mercados de datos basados en la nube:

        Lecturas relacionadas

        Gracias por leer nuestro sitio web’Guía del Data Mart. Para seguir aprendiendo y desarrollando su base de conocimientos, explore los recursos adicionales pertinentes que aparecen a continuación:

          Deja un comentario