¿Qué quieres aprender?

Máster en Business Intelligence y Big Data (MBIBD)

Máster en Business Intelligence y Big Data (MBIBD)

Instituto Europeo de Posgrado (IEP)

Máster online

Descuento Lectiva
6.900 € 2.414

Duración : 15 Meses

¿Quieres hablar con un asesor sobre este curso?

Objetivos

Adquirir competencias en programación y herramientas de desarrollo del Big Data, así como en Machine y Deep Learning e inteligencia artificial.

A quién va dirigido

Se dirige a todas las personas que estén interesados en adquirir las competencias requeridas para adaptar sus modelos de negocio por medio de inteligencia de negocio.

Requisitos

No presenta requisitos previos.

Temario completo de este curso

1. Introducción al Business Intelligence y Big Data
  • Fundamentos del Business Intelligence
  • El valor de los datos
  • Fundamentos del Big Data
  • Desarrollo de una Estrategia de Datos
  • Elementos clave para el Gobierno y Gestión de los datos
  • Organización Data Driven. Retos y oportunidades.

2. Herramientas de Big Data y Gobierno del Dato
  • Almacenamiento y procesamiento de la información
  • Información estructurada
  • Tecnologías Big Data
  • Análisis y visualización de la información
  • Herramienta SAS Visual Analytics
  • Gobierno del Dato.

3. Big Data Dentro de la Informática
  • Capacidad de procesamiento y paralelización extrema. Arquitecturas GPU vs CPU.
  • Núcleos Cuda. Escalabilidad.
  • Entornos de trabajo para arquitecturas Deep Learning. Tensor Flow, Keras, Pytorch.
  • Aprendizaje supervisado y no supervisado. Entrenamiento. Ejecución y Distribución de
  • modelos. Inteligencia Artificial.
  • Regresiones. Series temporales autorregresivas. Clusterización, kmeans.
  • Arboles de decisión: Random Forest. Xgboost.
  • Redes neuronales, Perceptrón Multicapa. Redes Convolucionales.

4. Técnicas de Datamining para el Negocio:
  • Planteamiento del problema. Análisis supervisado: regresión y clasificación. Análisis no
  • supervisado.
  • Preparación de datos en análisis supervisado. Entrenamiento, validación y test.
  • Validación cruzada (cross validation).
  • Regresión lineal y logística.
  • Arboles de decisión.
  • Redes neuronales: perceptrón multicapa.
  • Evaluación de resultados: curva ROC, lift chart, AUC, Accuracy, F-score, MSE...
  • Dicotomía sesgo – varianza en data mining. Curva de aprendizaje.
  • Análisis no supervisado: PCA y K-means.

5. Casos de uso Data Management:
  • Definición de procesos de negocio. BMP’s y principales KPI’s.
  • Remodelización. Del Modelo relacional al Modelo en estrella. Desnormalizaciones. Bucles.
  • Procesos ETL (Extracción Transformación y Carga). Cargas masivas. Staging.
  • Historificación. Agregados.
  • Herramientas: ETLs open y comerciales. Herramientas de auto gestión. Business Objects.
  • Algoritmos de optimización.
  • Caso de uso. Monitorización en tiempo real de web de ventas vía ingesta de logs (desestructurado) y datos de ventas (estructurado).

6. Casos de uso en Finanzas:
  • El dato a la información: de la métrica al KPI y las medidas de la vanidad.
  • La selección y reducción de datos: informes periódicos- informes ad hoc. Coste de mantener más información de la necesaria y oportunidades de la automatización.
  • Herramientas de seguimiento del negocio: evolutivos, year to date, grados de
  • cumplimiento, rentabilidad, amortización, Payback/ROI.
  • Series temporales, estacionalidad, comparación con el pasado y grupos de control.

7. Casos de uso en Marketing:
  • Modelos de Churn. Detectar posibles fugas de clientes antes de que sea demasiado tarde...
  • Modelos de valoración “inteligente” de clientes (Customer Life Time Value)
  • Crosselling y Upselling. Vincular y desarrollar al cliente.
  • Casos de uso no supervisado. Análisis cluster y PCA. Conociendo al cliente.
  • Marketing Modeling Mix. Evaluar el impacto de la inversión en medios y cómo optimizarla.

8. Herramientas y Profesionales de BIBD
  • El nuevo paradigma: open data y open source
  • Principales repositorios de open data
  • Landscape de herramientas de Data mining y Big Data
  • El nuevo científico de datos en las tres esferas: matemática/estadística, informática y conocimiento del negocio
  • La cultura de empresa en recursos humanos para incentivación, retención y actualización del talento.

9. Bases de datos Relacionales y no Relacionales
  • Metodologías. Modelo Entidad Relación. Normalización. Técnicas de modelado.
  • Estructura básica de una BBDD relacional. Patrones de diseño. Transacciones.
  • Implementaciones Físicas.
  • Bases de Datos operacionales vs Datawarehouse. Modelos en estrella y desnormalizaciones.
  • Principales engines actuales. Comparativa y campos de aplicación: Oracle, Microsoft, Mysql, MariaDB, Postgresql, Teradata, Vertica.
  • Caso práctico: Modelización de un catálogo de productos para track de ventas.
  • BBDD no relacionales. Paradigmas de procesamiento masivo: Apache Hbase. HDFS . Hadoop. Map Reduce.
  • Deep Learning. GPU, Núcleos cuda y procesamiento matricial. Frameworks en detalle: Tensor Flow, Keras, Pytorch.

10. Lenguajes de Programación de Nuevo Entorno
  • De C a Spark. Conceptos claves en los lenguajes de programación en la Ciencia de Datos.
  • Eficiencia, compatibilidad, curvas de aprendizaje. Tendencias actuales.
  • Herramientas de desarrollo. Principales IDEs de Programación en la ciencia de datos: Eclipse, R-
  • Studio, Spyder, Jupyter Notebook.
  • Caso práctico. Cotizaciones Nasdaq con python bajo Jupyter. Ingesta, tratamiento y visualización.
  • On Promise, Hosting y Cloud. Definiciones y modelos. Mantenimiento, escalabilidad y despliegues.
  • Cloud. Principales actores. Productos sobre cloud. Soluciones llave en mano.
  • Caso práctico AWS. Despliegue tienda online extremo a extremo.

ITINERARIO DE NEGOCIO

11. Transformación Digital
  • La Transformación Digital y la IV Revolución Industrial
  • Start-Up y Digital Business frente a empresas tradicionales
  • Contexto actual y desarrollo de nuevos modelos de negocio. Servicios Cloud
  • La Uberización de la Economía
  • Gestión de Recursos Humanos y Detección Digital de Talento
  • Aspectos Legales: La GDPR.

12. Reporting y Seguimiento del Negocio
  • Seguimiento del negocio: principales métricas y dimensiones
  • Detección de oportunidades y base para estudios ad hoc: fraude, avería, seguimiento de objetivos
  • Matriz abc-xyz de clientes.
  • Mapas de clientes utilizando cuartiles
  • Evaluación de acciones comerciales e interactuaciones con el cliente.

13. Datamining en la Digitalización
  • Minería de datos en la Industria 4.0 y transformación digital.
  • Inteligencia artificial en la gestión de clientes: user-centric, ad-centric, site-centric.
  • Fuentes de información: cookies, Id’s e información interna comportamental del cliente
  • Construcción de audiencias.
  • Personalización de campañas: banners, Display Campaing, Campañas de remarketing
  • Publicidad programática: DMP

ITINERARIO TÉCNICO
11. Modelización de datos estructurados
  • QL. Estandarización. Versión ANSI 92. Otros dialectos. Dialectos propietarios.
  • DDL. Definición de estructuras. Comandos principales.
  • DML. Manipulación de Datos. Comandos principales.
  • SELECT. Consulta de datos. JOINS. Relacionando Tablas.
  • AGRUPACIONES Y FUNCIONES VENTANA. Conteos y funciones estadísticas.
  • PRINCIPALES FUNCIONES. De cadena. Numéricas, Matemáticas, De fecha. Estadísticas,
  • IMPLEMENTACIONES PROPIETARIAS. Principales diferencias entre engines.Fechas. Nulos.
  • OPTIMIZACION. Herramientas de optimización de consultas. índices, vistas. Hints. Planes de ejecución.

12. Modelización de datos estructurados
  • Distribución de datos. HDFS. Hadoop. Hbase.
  • Diferencias con modelos relacionales.
  • Algoritmos distribuidos. ingeniería de Features.
  • Tratamiento de eventos. Buscadores. Recomendadores.
  • Tratamiento de imágenes. Redes Convolucionales sobre imagen.
  • Tratamiento semántico de la información. Bag of words. Clasificación. Análisis de Sentimiento.
  • Voz. Speech to text. VRU.Chat Bots,

13. Machine learning e Inteligencia Artificial
  • Python.- Instalación y componentes. Librerías. Comunidades de desarrollo. Módulos para la Ciencia de Datos.
  • Bases del lenguaje. Estructuras de control, funciones y variables. Módulos y paquetes.
  • Ingesta de datos. Scraping. Ficheros, BBDD. Ingeniería de Features.
  • Estructuras de datos. Listas, Diccionarios. Tratamiento y procesamiento. Pandas. Numpy,
  • Álgebra Computacional. Simpy.
  • Librería matemática, SciPy.
  • Machine Learning Sk-Learn
  • Deep Learning: Pytorch y Keras.

14. Storytelling del Dato
  • Optimización en la petición de la información: estados, fechas, clientes.
  • Introducción a Power Bi
  • Conexión con fuentes de datos
  • Objetos visuales Power Bi, posibilidades y mejores combinaciones para la narrativa.
  • Fuentes en Tableau
  • Visualización en Tableau

15. Proyecto Fin de Programa
Ver más