¿Qué quieres aprender?

Big Data y Análisis de Datos (165 h)

Big Data y Análisis de Datos (165 h)

SERPROFES

Curso subvencionado para trabajadores semipresencial

San Sebastián de los Reyes (Madrid)


Gratis

Duración : 3 Meses

¿Quieres hablar con un asesor sobre este curso?

Sedes

Localización

Fecha inicio

San Sebastián de los Reyes
Marzo 2026

Objetivos

• Adquirir dominio completo sobre el procesamiento de Big Data utilizando PySpark y Databricks. • Aplicar Spark MLlib para modelar datos y ejecutar predicciones en escenarios reales. • Desarrollar capacidades en análisis en tiempo real con Spark Streaming. • Aprender a implementar soluciones en SQL PySpark y colaborar en entornos de análisis de datos distribuidos. • Preparar a los estudiantes para roles avanzados en Big Data, fortaleciendo su perfil profesional en sectores de demanda como tecnología, finanzas, salud, y logística.

A quién va dirigido

Este curso está diseñado para profesionales y estudiantes de informática, ingeniería, estadística, matemáticas y áreas relacionadas, interesados en profundizar en el análisis de grandes volúmenes de datos y mejorar su perfil profesional. También es adecuado para cualquier persona con interés en transformar grandes datos en valor real para la toma de decisiones.

Requisitos

• Interés por la programación (Python idealmente); y la estadística. • Documentación: Poseer uno de los siguientes documentos en vigor: DNI o NIE.

Temario completo de este curso

Temario del Curso de Big Data y Análisis de Datos (165 h)

  • Módulo 1: Fundamentos de Big Data y Análisis de Datos (20 h)
    • Introducción al Big Data: conceptos clave, historia y evolución.
    • Tipos de datos: estructurados, no estructurados y semi-estructurados.
    • Introducción al procesamiento y almacenamiento de grandes volúmenes de datos. Introducción a Hadoop y
    • Spark como plataformas de análisis.
  • Módulo 2: Programación con Python para el Análisis de Datos (20 h)
    Introducción a Python para Big Data.
    Manipulación de datos con pandas.
    Visualización de datos: matplotlib y seaborn.
    Limpieza y preparación de datos.
    Prácticas: análisis exploratorio con datos reales.
  • Módulo 3: Introducción a PySpark (20 h)
    • Arquitectura y funcionamiento de PySpark.
    • Configuración del entorno y conceptos básicos.
    • Manipulación y procesamiento de datos con DataFrames.
    • Realización de consultas y filtrado de datos en PySpark.
    • Casos prácticos de análisis con PySpark.
  • Módulo 4: Procesamiento de Datos en Tiempo Real con Spark Streaming (25 h)
    • Introducción al procesamiento en tiempo real.
    • Arquitectura de Spark Streaming.
    • Integración de Spark Streaming con fuentes de datos en tiempo real (Kafka, Flume).
    • Desarrollo de aplicaciones de análisis en tiempo real.
    • Prácticas: análisis en tiempo real de flujos de datos de redes sociales.
  • Módulo 5: Machine Learning con Spark MLlib (30 h)
    • Fundamentos de Machine Learning en el contexto de Big Data.
    • Herramientas y algoritmos de MLlib.
    • Modelos de regresión y clasificación.
    • Clustering y segmentación de datos.
    • Implementación de modelos predictivos en Spark.
    • Prácticas: creación de un modelo predictivo con datos reales.
  • Módulo 6: Almacenamiento y Consultas con SQL PySpark y Databricks (25 h)
    • Introducción a SQL en el entorno PySpark.
    • Consultas complejas y manejo de bases de datos.
      Integración de PySpark y Databricks para análisis avanzados.
    • Creación de pipelines de datos en Databricks.
    • Prácticas: consulta y visualización de grandes volúmenes de datos.
  • Módulo 7: Casos Prácticos y Resolución de Ejercicios Reales (25 h)
    • Análisis y solución de problemas reales en diferentes sectores: tecnología, finanzas y salud.
  • Proyecto de fin de curso: desarrollo de una aplicación de Big Data en un entorno real.
    • Implementación de un pipeline de datos completo.
    • Documentación y presentación de resultados.
Ver más