Curso online
Duración : 15 Semanas
Presentar de manera sistemática las técnicas y herramientas que permiten analizar grandes cantidades de datos y descubrir relaciones ocultas pero presentes en ellos de manera de contribuir con nueva información al proceso de toma de decisiones y predicción de fenómenos futuros.
Capacitar en la aplicación y el uso de las técnicas y herramientas necesarias para desarrollar modelos de minería de datos de manera que el participante, luego de haber terminado el curso, esté en condiciones de aplicarlos en su tarea diaria.
Aplicar los contenidos aprendidos en casos de aplicación relacionados con las disciplinas de la ingeniería de cada participante o en casos simulados presentados por el docente: producción, mantenimiento, medioambiente, logística, diseño industrial, desarrollo de software, marketing.
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Temario completo de este curso
Contenido Académico:
Introducción a la minería de datos
¿Qué es y qué no es Data Mining? Aplicaciones de la minería de datos en las organizaciones: predicciones bursátiles, marketing, detección de fraudes, patrones de fuga, producción, mantenimiento, logística, ciencia. Introducción a las herramientas deminería de datos: métodos predictivos y descriptivos. Tareas de Data Mining: clasificación, agrupamiento (clustering), descubrimiento de reglas de asociación, descubrimiento de patrones secuenciales, regresión, detección de anomalías.
Selección y pre-procesamiento de datos
Introducción a los proyectos de inteligencia de negocios (Business Intelligence). Manejode datos e información. Bases de datos (Data Warehousing). Selección e integraciónde datos. Pre-procesamiento de datos: limpieza, integración, transformación, reducción,y discretización de datos.
Clasificación
Ejemplos de problemas de clasificación. Árboles de decisión. Clasificadores basados enreglas. Métodos bayesianos: Naïve Bayes. Máquinas de soporte vectorial (Support Vector Machines). Redes Neuronales: perceptrón multicapa. Vecinos más cercanos.Implementación de clasificadorescon paquete de software libre WEKA (Universidad deWaikato, Nueva Zelandia).
Clustering
Aplicaciones del análisis de clustering: descriptiva y sumarización. Clasificación de de clusters: jerárquico/particional, exclusivos/no-exclusivos, fuzzy/no-fuzzy, parcial/completo, heterogéneo/homogéneo. Tipo de clusters: bien separados,basadosen centros, contiguos, basados en densidad, conceptuales, descritos por unafunción objetivo. Medidas de similaridad. Algoritmos de clustering: vecinos máscercanos,clustering jerárquico y basado en densidad. Análisis de casos.
Aspectos prácticos
Aspectos prácticos al implementar clasificadores: sobreajuste, subajuste, valoresfaltantes, expresividad, evaluación y comparación de modelos (métricas y métodos).Reducción de la dimensionalidad. Desbalanceo de clases.
Multimedia Data Mining
Aplicación de herramientas de Data Mining en datos provenientes de imágenes, videos, audio y habla.
Casos de aplicación de Data Mining
Introducción al paquete de software libre “R” (R Foundation for Statistical Computing). Aplicación de los métodos de regresión múltiple y regresión LASSO. Aplicación de redes neuronales aun proceso de negocios. Determinación de las causas de fallaempleando la metodología de Clustering. Aplicación de la reducción de dimensionalidaden un proceso industrial.
Big Data
¿Qué es Big Data? Gestión de grandes volúmenes de datos ¿Cómo trabaja Map-Reduce? Entorno Open-Source de software para procesamiento y almacenamiento distribuido: Apache Hadoop. Algoritmos de Data Mining en Big Data. Computación iterativa distribuida. Entorno para el procesamiento en cluster de computadoras: Apache Spark.
Trabajo final
El trabajo final se realiza en forma grupal y tiene como finalidad que los participantes apliquen los conocimientos adquiridos durante el curso en la resolución de problemas de casos reales de sus organizaciones. Algunos ejemplos de trabajos presentados en ediciones anteriores: