E.T.L en el Análisis de Datos

Cada vez que trabajamos con bases de datos chicas o medianas, ya sean de distintas fuentes(Sql, Excel,u otras) y comenzamos con procesos de transformación, filtrado,cargas, sin darnos cuentas estamos aplicando un proceso o método llamado E.T.L(Extrac, transformation,load)

Introduccion

El proceso ETL es un concepto que va relacionado con la transformación y modelación de datos para su posterior análisis. Este proceso permite cargar conjuntos de datos a un mismo modelo para crear relaciones entre la información importada de distintas fuentes. Por lo tanto, es indispensable cuando hablamos de Business Intelligence. Algo que sucede muy a menudo en las empresas es la acumulación de grandes cantidades de datos, y la mayoría de veces, esto da lugar a bases de datos desestructuradas que contienen información mal organizada. Además, es probable que todos estos datos estén almacenados en distintos sitios e incluso en distintos formatos y, por lo tanto, se deba saltar de archivo para consultar la información. Así pues, el objetivo del proceso ETL se basa en cargar todos estos grandes conjuntos de datos que se encuentran en distintos orígenes, para transformar y limpiar su información y poder analizarla posteriormente.

Cómo funciona el proceso ETL

El proceso ETL funciona a través de 3 fases diferenciadas y, de hecho, su nombre proviene de las siglas de cada una de ellas: Extract, Transform and Load, haciendo referencia a todo el recorrido basado en obtener los datos, transformarlos y modelarlos para finalmente cargarlos a un modelo.

image.png

ETL en Power BI

Cómo se integra el proceso ETL en Power BI Power BI, como Business Intelligence líder en el mercado, funciona precisamente a través de este proceso ETL y lo hace gracias a Power Query, la funcionalidad que se encarga de integrar cada una de las fases del proceso a la solución de inteligencia empresarial. ¿Pero cómo se ve representado este proceso en la interfaz de Power BI?

  • • Para la primera fase (obtener datos) tenemos disponible un desplegable con todas las opciones de fuentes de datos desde las cuales nos podemos importar la información

image.png

  • • Para la segunda fase (transformar datos) Power BI cuenta con el editor de Power Query, a través del cual tenemos una gran cantidad de posibilidades para transformar y modelar información.

image.png

  • • Y, por último, en la tercera fase podemos cargar todos los datos modificados a nuestro modelo.

image.png Fuente : aglaia.es/blog/bi/que-es-proceso-etl