Curso presencial
Madrid
Duración : 5 Días
Los procesos ETL (extract, transform and load) permiten extraer, tratar y cargar los datos procedentes de diferentes fuentes origen en un sistema datawarehouse o Data Mart.Punto clave en el desarrollo de un datawarehouse. Se estiman que las tareas ETL suponen el 70% del trabajo de desarrollo de un datawarehouse. PowerCenter Express es la versión libre de PowerCenter herramienta líder en integración de datos. La versión Express contiene todas las funcionalidades ETL principales de PowerCenter.
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Sedes
Localización
Fecha inicio
Objetivos
Llegar a obtener los conocimientos necesarios que permitan extraer, tratar y cargar los datos procedentes de diferentes fuentes en un sistema datawarehouse
A quién va dirigido
Profesionales con necesidades de integración de información. Jefes de proyecto, consultores, analistas y programadores IT del área Business Intelligence, o de otras áreas con necesidades de formación en Business Intelligence. Consultores junior o recién licenciados con conocimientos de base de datos y programación.
Requisitos
Profesional con conocimientos en bases de datos y programación e interés por enfocarse a Business Intelligence. No necesaria experiencia previa en Business Intelligence.
Temario completo de este curso
Diseño y desarrollo de procesos ETL.
· Definición de proceso ETL:
o Función del ETL en un sistema Business Intelligence
o Áreas de datos que intervienen en un proceso ETL
o Etapas de un proceso ETL: extracción, transformación y carga
· Etapas de Extracción, Transformación y carga de datos:
o Fuentes origen. Tipología y conectores
o Tipos de extracción
o Frecuencia y modo de captura de datos
o Limpieza de datos. Validaciones técnicas y de negocio
o Principales pasos de transformación: homogeneización, normalización, selección, fusión, unión, reglas de negocio, etc..
o Volcado de datos. Tipos de volcado.
o Frecuencia de carga.
o Actualización de dimensiones.
· Planificación de procesos ETL:
o Ventana de procesos. Sincronización con sistemas operacionales.
o Mapa de Jobs.
o Dependencia de procesos
o Ejecución, control y reejecución de procesos.
o Paralelismo de procesos
· Herramientas de mercado y tendencias-:
o Principales herramientas ETL de mercado
o Cuadrante Gartner integración de datos 2014.
o Codificación manual vs herramienta de mercado.
o Consideraciones en la selección de una herramienta ETL
o Tendencias tecnológicas en integración de datos.
Desarrollo de procesos ETL en PowerCenter Express.
· Introducción a PowerCenter Express:
o Introducción a las soluciones B.I. de Informatica
o Capacidades de PowerCenter Express
o Repositorio de metadata y servicios de Integración de datos.
· Gestión de objetos de datos:
o Objetos de datos físicos: Excel, csv, xml, ficheros host, BBDD, servicios web, fuentes de datos no estructurados
o Objetos de datos lógicos
o Perfilado de datos
· Diseño de transformaciones:
o Diseño del source y del target
o Diseño de mappings: ordenaciones, agregaciones, expresiones, filtros, objetos Java, uniones, normalizadores, rangos, lookup, procedimientos almacenados, estrategias de actualización, secuencias, etc..
o Diseño de mapplets. Utilidad de mapplets
· Diseño de workflows:
o Creación de tareas
o Generación de flujo, condiciones y ramificaciones.
· Despliegue y monitorización de procesos:
o Despliegue de workflows
o Ejecución de workflows
o Monitorización de workflows