Se puede pensar en ello como una limpieza de datos. ETL trata de extracción, transformación y carga, donde un programa habilita a los negocios consolidar sus datos moviéndolos de un sitio a otro. No importa que los datos vengan en diferentes formas o formatos.
Los datos pueden venir de cualquier sitio. ETL es suficientemente potente para manejar todos estos datos entremezclados. Por ejemplo, un grupo financiero puede tener información de un cliente en varios sitios, y cada sitio puede tener la información listada de diferentes maneras.
Por ejemplo, un departamento puede tener listado al usuario por su nombre mientras que otros lo tiene controlado por número. ETL puede agrupar todos estos datos y consolidarlos en un formato uniforme, como por ejemplo para almacenarlos en una base de datos o en otro tipo de sitio. Otra forma en que las compañías usan ETL es para mover información a otra aplicación de forma permanente.
Por ejemplo, los datos de un software de texto pueden traducirse a letras y números para un mejor seguimiento en una base de datos o en una hoja de cálculo. Esto suele ser bastante útil para hacer copias de información según se están haciendo los cambios.
Otra importante función de este sistema es la “limpieza” de datos. Los protocolos que manejan ETL también incluyen la eliminación de datos duplicados o que están fragmentados. De esta manera, cuando pasan de un sitio a otro es más fácil hacer el almacenamiento. Estas operaciones de limpieza pueden también incluir eliminar ciertos tipos de datos en el proceso. Si no quieres incluir cierta información, puedes personalizar el software ETL para que la elimine en los cambios.
La parte de transformación es la más potente en el sistema. ETL puede transformar más que solamente datos de diferentes departamentos. Puede hacerlo de diferentes fuentes todas juntas. Por ejemplo, los datos en un correo electrónico pueden ser transformados junto a otros tipos de datos de otra índole, y así tener datos expuestos en un solo formato como resultado final. Dicho de otra manera, se pueden fundir estos datos de una forma común. Muchos fabricantes tienen su propio sistema ETL.