5.3.1. ALMACENES DE
DATOS (DATA WAREHOUSE).
Es una
base de datos corporativa que se caracteriza por integrar y depurar información
de una o más fuentes distintas, para luego procesarla permitiendo su análisis
desde infinidad de perspectivas y con grandes velocidades de respuesta. La
creación de un datawarehouse representa en la mayoría de las ocasiones el
primer paso, desde el punto de vista técnico, para implantar una solución
completa y fiable de Business Intelligence.
La
ventaja principal de este tipo de bases de datos radica en las estructuras en
las que se almacena la información. Este tipo de persistencia de la información
es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de
la misma (siempre en un entorno diferente a los sistemas operacionales).
El
término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce
literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho
más que eso. Según definió el propio Bill Inmon, un datawarehouse se caracteriza
por ser:
• Integrado: los datos almacenados en el
datawarehouse deben integrarse en una estructura consistente, por lo que las
inconsistencias existentes entre los diversos sistemas operacionales deben ser
eliminadas. La información suele estructurarse también en distintos niveles de
detalle para adecuarse a las distintas necesidades de los usuarios.
• Temático: sólo los datos necesarios
para el proceso de generación del conocimiento del negocio se integran desde el
entorno operacional. Los datos se organizan por temas para facilitar su acceso
y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos
sobre clientes pueden ser consolidados en una única tabla del datawarehouse. De
esta forma, las peticiones de información sobre clientes serán más fáciles de
responder dado que toda la información reside en el mismo lugar.
• Histórico: el tiempo es parte
implícita de la información contenida en un datawarehouse. En los sistemas
operacionales, los datos siempre reflejan el estado de la actividad del negocio
en el momento presente. Por el contrario, la información almacenada en el
datawarehouse sirve, entre otras cosas, para realizar análisis de tendencias.
Por lo tanto, el datawarehouse se carga con los distintos valores que toma una
variable en el tiempo para permitir comparaciones.
• No volátil: el almacén de información
de un datawarehouse existe para ser leído, pero no modificado. La información
es por tanto permanente, significando la actualización del datawarehouse la
incorporación de los últimos valores que tomaron las distintas variables
contenidas en él sin ningún tipo de acción sobre lo que ya existía.
Una de
las claves del éxito en la construcción de un datawarehouse es el desarrollo de
forma gradual, seleccionando a un departamento usuario como piloto y
expandiendo progresivamente el almacén de datos a los demás usuarios. Por ello
es importante elegir este usuario inicial o piloto, siendo importante que sea
un departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas
es muy alta y se pueda obtener y medir resultados a corto plazo. El proceso de
construcción del mismo, denominado ETL (Extracción, Transformación y Carga), a
partir de los sistemas operaciones de una compañía se da de la siguiente forma:
1.Extracción: obtención de información de
las distintas fuentes tanto internas como externas.
2.Transformación: filtrado, limpieza,
depuración, homogeneización y agrupación de la información.
3. Carga: organización y actualización de
los datos y los metadatos en la base de datos.
También me encuentras en:
Comentarios
Publicar un comentario