Procesos ETL

Procesos ETL


¿Que es ETL?

   Es un acróstico que indica una de las mejores prácticas en procesos de administración de la información, y que hace referencia a las posibles fuentes de datos, las adecuaciones y publicación de los resultados mismos en un "Data warehouse", Base de datos, data mart es decir un repositorio común para los posibles clientes destino que leen esta información resultante y que normalmente la usan para tomar decisiones a partir de la estadística y análisis de esta.

   Este concepto se basa en tres palabras inglesas, Extract, Transform y Load que a su vez indican la etapa del proceso mismo, la consulta de las diversas fuentes, la adecuación y mantenimiento de las misma y el método de ofrecer los resultados, es una buena práctica documentar en las tres etapas para localizar de manera adecuada donde se pueden hacer adecuaciones, así como las razones, las fechas y quien las sugiere, quien propone y quien desarrolla.

   Una de las razones principales es que por la naturaleza de los emprendimientos se desarrollan soluciones para cada área laboral para cubrir las necesidades de cada una de ellas, pero no siempre se han desarrollado del mismo modo; otra de las razones es por la adquisición de un emprendimiento dentro de otro, de la misma forma que la anterior la información generada en estos emprendimientos fueron desarrollados para cubrir sus propias necesidades de información, sin embargo para una correcta toma de decisiones se deben incluir los datos fuente hasta los administradores de la empresa destino. En mi experiencia personal incluso he visto emprendimientos que fueron desarrollados con una administración limitada solo a la información que les pedían las leyes o compromisos fiscales, sin embargo en estos documentos también se incluía información útil para los mismos comercios, en estos casos se recomienda una captura de estos documentos para cubrir las nuevas necesidades de las áreas destino, normalmente administración, contabilidad o mercadotecnia.

Extracción

   Es el proceso que sufre la información para reunirla en un punto en común sin importar las diversas fuentes, en este punto no sufren modificaciones en su contenido por el hecho que es importante la información original puesto que se puede requerir mas adelante algún dato importante, así el único cambio que sufre en este punto es la unión de esta en un medio en común para su posterior trabajo y consulta.

Transformación

   En este punto es cuando la información sufre modificaciones y uniones para que se adapte a los resultados requeridos para las diversas áreas que requieren esta información. Es el punto mas común para aplicar las reglas del negocio propias de la operación de cada una de las áreas, como la información original ya está en un medio común es mas práctica su modificación y correcciones, como vemos en este punto no es producción (fuente de información) ni presentación de resultados, por eso también se le conoce como middleware o punto medio, se evalúan los resultados, esto mismo hace que este paso sea poco evaluado en logros, por eso es muy importante fijar metas y objetivos de este proyecto, también por la naturaleza de el área es un buen punto para desarrollar los manuales y procedimientos de las demás áreas cuando adolecen de ello o se han modificado.

Carga (Load)
   Este es el último punto del proceso y consiste en colocar los resultados en un medio donde sea fácil su extracción para las herramientas de inteligencia de negocios, cubos, estadística y/o toma de decisiones.

Procesos
Quienes intervienen en el ETL
Cuando aplicar un ETL
Cuanto cuesta un ETL
Herramientas Libres
Herramientas comerciales
Formatos recomendables
Conclusión
Evaluación (preguntas a cubrir como si este contenido fuera un curso)
Infografía

No hay comentarios.:

Publicar un comentario