¿Qué quieres aprender?

Programa de Especialización en Big Data

Programa de Especialización en Big Data

IMF CAPITOL

Postgrado semipresencial

Madrid

Descuento Lectiva
3.300 € 2.160
¿Quieres hablar con un asesor sobre este curso?

Sedes

Localización

Fecha inicio

Madrid
Septiembre 2021

Requisitos

Para poder cursar el programa de especialización en Big Data será requisito estar en posesión del título de Técnico Superior correspondiente con alguno de los siguientes ciclos formativos de grado superior vinculados a esta formación: Administración de Sistemas Informáticos en Red. Desarrollo de Aplicaciones Multiplataforma. Desarrollo de Aplicaciones Web. Sistemas de Telecomunicaciones e Informáticos. Automatización y robótica industrial. Mecatrónica Industrial.

Temario completo de este curso

MÓDULO I
  • Programación en entornos Big Data
  • Lenguajes para Big Data:
  • Características de los lenguajes de programación para Big Data.
  • Tipos de datos.
  • Por categorías: estructurados, no estructurados y multi-estructurados o híbridos.
  • Por origen: web y redes sociales, comunicación entre máquinas, transacciones, biométricos y generados por personas.
  • Estructuras de control: de selección, iterativas. Funciones. Recursividad.
  • Librerías específicas.
  • Entrada y salida de datos:
  • Opciones de entrada y salida habituales.
  • Formatos habituales en Big Data.
  • Funciones para trabajar con diferentes formatos.
  • Entornos de desarrollo:
  • Entornos de desarrollo para programación Big Data.
  • Instalación y configuración de entornos de desarrollo en local.
  • Instalación y configuración de entornos de desarrollo en remoto.
  • Análisis y visualización de datos:
  • Análisis descriptivo. Utilización de un histórico de datos. Identificación de comportamientos.
  • Análisis predictivo. Creación de modelos. Establecimiento de un patrón e identifcación de las principales tendencias.
  • Análisis prescriptivo. Técnicas de simulación y optimización.
  • Visualización de datos.
MÓDULO II
  • Frameworks para Big Data
  • Infraestructuras para Big Data:
  • El paradigma Big Data. Modelo 5V: velocidad, volumen, variedad de los datos, veracidad y valor.
  • Sistemas de computación distribuida: clusters, cloud.
  • Componentes básicos y requisitos para la arquitectura de un sistema Big Data.
  • Componentes de la arquitectura Big Data:
  • Infraestructura en almacenamiento básica para la ingesta de datos.
  • Infraestructuras para el procesamiento de datos.
  • Herramientas adicionales.
  • Almacenamiento distribuido:
  • Características de los sistemas de ficheros distribuidos.
  • Almacenamiento de información permanente.
  • Sistemas multiusuario.
  • Transparencia en la identificación y en la ubicación.
  • Escalabilidad.
  • Consistencia y seguridad.
  • Capacidad, redundancia y alta disponibilidad. Tolerancia a fallos.
  • Despliegue de nodos de almacenamiento,
  • Administración y acceso a los datos.
  • Monitorización de sistemas de ficheros distribuidos. Herramientas para monitorizar aplicaciones y servidores.
  • Administración de entornos Big Data:
  • Paradigma de computación distribuida y en paralelo, proceso cercano a los datos.
  • Aplicaciones y técnicas de procesamiento distribuido.
  • Ingesta de datos.
  • Metodología MapReduce.
  • Rendimiento y monitorización de los procesos.
  • Administración de seguridad de los datos.
MÓDULO III
  • Procesamiento de datos
  • Ingesta de datos:
  • Tecnologías de ingesta de datos.
  • Origen y formato de los datos. Opendata.
  • Latencia y disponibilidad de los datos.
  • Causas de la latencia.
  • Funciones que dependen de la latencia.
  • Formas de mitigar la latencia.
  • Actualizaciones de los datos. Histórico de cambios.
  • Extracción de datos.
  • Preprocesado de datos:
  • Transformaciones de los datos.
  • Destino de los datos. Consumidores de datos.
  • Calidad de los datos. Formato, origen, veracidad y valor.
  • Seguridad de los datos.
  • Procesamiento de datos:
  • Introducción a los sistemas de procesamiento Big Data.
  • Procesamiento por lotes. Aplicaciones y características.
  • Procesamiento en streaming. Aplicaciones y características.
MÓDULO IV
  • Bases de datos no relacionales
  • Arquitecturas disponibles para el almacenamiento masivo de datos:
  • Características principales, criterios de selección.
  • Documental. Catálogos, perfles de usuario y sistemas de administración de contenido.
  • Clave-valor. Escalado horizontal.
  • Basado en columnas. Familias de columnas.
  • Grafos. Nodos y bordes.
  • Series temporales.
  • Datos de objetos.
  • Datos de índice externo.
  • Casos de uso para cada arquitectura:
  • Documental.
  • Clave-valor.
  • Basado en columnas.
  • Grafos.
  • Bases de datos no relacionales:
  • Características principales: flexibilidad, escalabilidad, alto rendimiento y funcionabilidad.
  • Ejemplos de uso más frecuente.
  • Instalación y administración de bases de datos no relacionales
  • Técnicas y procedimientos.
  • Consulta de datos:
  • Principales herramientas. Características y criterios de selección.
  • Programación de consultas y búsquedas en función de la arquitectura utilizada.
Ver más