Para terminar con nuestro artículo sobre la integración de datos y las variaciones que nos podemos encontrar para su aplicación, veremos como son las bases de datos de red. Como hemos visto en los anteriores artículos, un almacén de datos es una base de datos que almacena información para otras bases de datos usando un formato común.
Es lo más específica que podemos ser cuando describimos este tipo de almacenamiento de datos. No hay una definición unificada que nos diga qué son los almacenes de datos o como los diseñadores deberían construirlos. Como resultado, hay varias maneras de crearlas, y entre ellas pueden parecer y comportarse de una manera muy diferente. En general, las peticiones a un almacén de datos se resolverán en muy poco tiempo, y es porque ya ha hecho la mayoría de trabajo para extraer convertir y combina los datos.
El lado del usuario de un almacén de datos se llama “front-end”, por lo que desde esta perspectiva es una buena manera de integrar los datos.
Desde una perspectiva de “back-end”, es una historia diferente. Los administradores de las bases de datos puede tener que poner mucho esfuerzo en uno de estos sistemas de almacenamiento de datos para hacerlo efectivo y eficiente. Convirtiendo los datos recolectados de diferentes fuentes en un formato común, puede ser particularmente difícil. El sistema requiere un desarrollo consistente para describir y codificar los datos.
El almacén puede tener una base de datos suficientemente grande para almacenar datos agrupados de varias fuentes. Algunos sistemas incluyen un paso adicional. Los almacenes de datos se hacen cargo de agregar los datos, mientras que con un paso adicional se responde a las peticiones de los usuarios recuperando y combinando los datos apropiados del almacén.
Un problema con los almacenes de datos es que la información que contienen no es siempre la más actual. Esto es por la manera en que funcionan – cogen información de otras bases de datos periódicamente. Si los datos en las bases de datos cambian entre las extracciones, las peticiones no resultarán ser las más actualizadas. Si los datos en un sistema raramente cambian, no hay problema. Sin embargo, para otras aplicaciones es un verdadero problema.
Si volvemos al ejemplo del artículo anterior sobre las condiciones de tráfico y el mapa, el mapa normalmente no tendrá demasiados cambios, mientras que el tráfico puede cambiar de forma dramática en un corto espacio de tiempo. Un almacén de datos puede no extraer los datos de forma frecuente, lo cual significa que la información importante puede no ser fiable. Para ciertas aplicaciones es mejor usar un sistema más adecuados.
¿Qué alternativa tenemos al sistema de almacenamiento de datos? Una manera que los expertos están desarrollando es diseñar sistemas que cogen los datos directamente de fuentes de datos individuales. Al no tener una base de datos centralizada dedicada para analizar, categorizar e integrar los datos en preparación de nuevas peticiones, estas responsabilidades caen en otras partes del sistema. La idea es hacer todo esto de una forma estructurada y esquemática.

La visión unificada de una petición procesada es un esquema global. La estructura de las varias fuentes de datos y la manera en que se relacionan entre ellas es la fuente. La manera en que la fuente y el esquema global se interrelacionan se llama mapeado. Piensa en la fuente como un anteproyecto de todos los datos dentro del sistema, mientras que el esquema global es un anteproyecto para el visionado presentado en respuesta a una petición.
Hay otras dos maneras principales para resolver peticiones en un sistema de datos integrados, que son visionados globales y locales. Cada acercamiento de este tipo se centra en una parte particular de todo el sistema, y tiene ventajas y desventajas. En el sistema de visionado global, el enfoque es en el esquema global.
Mientras que las fuentes de datos se mantengan consistentes, este sistema funciona bien. Es fácil cambiar este tipo de configuración, lo cual significa que no es difícil analizar los datos de maneras diferentes. Sin embargo, añadir o quitar fuentes de datos al sistema es problemático porque afecta a todo el sistema.
La técnica de visionado local usa un sistema opuesto al anterior. Se centra en las fuentes de datos. Mientras que el esquema globo se mantenga constante, es fácil añadir o quitar las fuentes de datos del sistema. Es más complicado cambiar los parámetros del esquema global. Si quieres analizar las fuentes de datos de alguna manera nueva, tienes que redefinir todo el sistema.