Curso subvencionado para trabajadores online
Duración : 3 Meses
Aprende a procesar datos y crear modelos predictivos con Python, PySpark y MLlib. Curso online en aula virtual 100% subvencionado.
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Objetivos
Introducirte al ecosistema Big Data. Analizar datos con PySpark. Aplicar algoritmos de Machine Learning. Utilizar Databricks y Spark Streaming.
A quién va dirigido
Profesionales en activo con interés en análisis de datos, ingeniería, IT o gestión de proyectos. Se admite también un porcentaje de participantes de otros sectores y personas desempleadas.
Requisitos
Ser trabajador/a en activo. Conocimientos básicos de programación (Python recomendable).
Temario completo de este curso
Este curso ofrece una introducción sólida al ecosistema Big Data, abordando tecnologías clave como Hadoop, Spark y arquitecturas distribuidas para el procesamiento eficiente de datos masivos. Se trabajará con PySpark para realizar análisis de grandes volúmenes de datos, incluyendo la ejecución de consultas SQL sobre conjuntos complejos. A través de MLlib, se explorarán modelos de clasificación, regresión y técnicas para evaluar resultados predictivos. También se aprenderá a utilizar Spark Streaming para el procesamiento en tiempo real de flujos de datos. Todo ello se reforzará con casos prácticos integrados mediante plataformas como Databricks y Google Colab. Finalmente, se abordará la exportación e interpretación de resultados para su aplicación en contextos reales de negocio e ingeniería.