Big Data y Análisis de Datos (165 h)

SERPROFES

Curso subvencionado para trabajadores semipresencial

San Sebastián de los Reyes (Madrid)

Gratis

Duración : 3 Meses

Nombre Apellidos

e-mail Teléfono

País de residencia Provincia

Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.

¿Quieres hablar con un asesor sobre este curso?

900 49 47 47

Sedes

Localización

Fecha inicio

San Sebastián de los Reyes

Marzo 2026

Objetivos

• Adquirir dominio completo sobre el procesamiento de Big Data utilizando PySpark y Databricks. • Aplicar Spark MLlib para modelar datos y ejecutar predicciones en escenarios reales. • Desarrollar capacidades en análisis en tiempo real con Spark Streaming. • Aprender a implementar soluciones en SQL PySpark y colaborar en entornos de análisis de datos distribuidos. • Preparar a los estudiantes para roles avanzados en Big Data, fortaleciendo su perfil profesional en sectores de demanda como tecnología, finanzas, salud, y logística.

A quién va dirigido

Este curso está diseñado para profesionales y estudiantes de informática, ingeniería, estadística, matemáticas y áreas relacionadas, interesados en profundizar en el análisis de grandes volúmenes de datos y mejorar su perfil profesional. También es adecuado para cualquier persona con interés en transformar grandes datos en valor real para la toma de decisiones.

Requisitos

• Interés por la programación (Python idealmente); y la estadística. • Documentación: Poseer uno de los siguientes documentos en vigor: DNI o NIE.

Temario completo de este curso

Temario del Curso de Big Data y Análisis de Datos (165 h)

Módulo 1: Fundamentos de Big Data y Análisis de Datos (20 h)
- Introducción al Big Data: conceptos clave, historia y evolución.
- Tipos de datos: estructurados, no estructurados y semi-estructurados.
- Introducción al procesamiento y almacenamiento de grandes volúmenes de datos. Introducción a Hadoop y
- Spark como plataformas de análisis.
Módulo 2: Programación con Python para el Análisis de Datos (20 h)
Introducción a Python para Big Data.
Manipulación de datos con pandas.
Visualización de datos: matplotlib y seaborn.
Limpieza y preparación de datos.
Prácticas: análisis exploratorio con datos reales.
Módulo 3: Introducción a PySpark (20 h)
- Arquitectura y funcionamiento de PySpark.
- Configuración del entorno y conceptos básicos.
- Manipulación y procesamiento de datos con DataFrames.
- Realización de consultas y filtrado de datos en PySpark.
- Casos prácticos de análisis con PySpark.
Módulo 4: Procesamiento de Datos en Tiempo Real con Spark Streaming (25 h)
- Introducción al procesamiento en tiempo real.
- Arquitectura de Spark Streaming.
- Integración de Spark Streaming con fuentes de datos en tiempo real (Kafka, Flume).
- Desarrollo de aplicaciones de análisis en tiempo real.
- Prácticas: análisis en tiempo real de flujos de datos de redes sociales.
Módulo 5: Machine Learning con Spark MLlib (30 h)
- Fundamentos de Machine Learning en el contexto de Big Data.
- Herramientas y algoritmos de MLlib.
- Modelos de regresión y clasificación.
- Clustering y segmentación de datos.
- Implementación de modelos predictivos en Spark.
- Prácticas: creación de un modelo predictivo con datos reales.
Módulo 6: Almacenamiento y Consultas con SQL PySpark y Databricks (25 h)
- Introducción a SQL en el entorno PySpark.
- Consultas complejas y manejo de bases de datos.
  Integración de PySpark y Databricks para análisis avanzados.
- Creación de pipelines de datos en Databricks.
- Prácticas: consulta y visualización de grandes volúmenes de datos.
Módulo 7: Casos Prácticos y Resolución de Ejercicios Reales (25 h)
- Análisis y solución de problemas reales en diferentes sectores: tecnología, finanzas y salud.
Proyecto de fin de curso: desarrollo de una aplicación de Big Data en un entorno real.
- Implementación de un pipeline de datos completo.
- Documentación y presentación de resultados.

Aliad Conocimiento y Servicio, S.L. | Curso subvencionado en Madrid

de acceso y transmisión de datos (60 horas) MF0490_3: Gestión de servicios en el sistema informático (90 horas) MP0175: Módulo de prácticas profesionales

Gratis

CADEL Formación | Curso subvencionado para trabajadores en Leganés (Madrid)

Módulo 1 — Introducción a la ciberseguridad (20 h) Fundamentos de ciberseguridad Amenazas y vulnerabilidades : Ingeniería social, Vulnerabilidades

Gratis

ADF FORMACION | Curso subvencionado en Fuenlabrada (Madrid)

Relación secuencial de módulos formativos: - Módulo 1. Excel intermedio (25 horas) - Módulo 2. Excel Avanzado (75 horas) - Módulo 3. Power BI (50 hora

Gratis

INKOR | Curso subvencionado en Madrid

(navegación web, geolocalización, audiencias TV,…) - El Big Data como solución al tratamiento masivo de datos: definición e historia desde su invención

Gratis

Cámara de Comercio de Madrid | Curso en Madrid

a trabajar en el análisis y modelado de datos.

480 €

Big Data y Análisis de Datos (165 h)

Big Data y Análisis de Datos (165 h)

Seguridad informática

Gestión de la Ciberseguridad en PYMES. Comercio Electrónico Seguro- COMM03

Excel Avanzado y Power BI

INTRODUCCIÓN AL BIG DATA E INTELIGENCIA ARTIFICIAL

POWER BI

Añade cursos similaresy compara para elegir mejor

Añade cursos similares
y compara para elegir mejor