Curso Superior de Big Data

Core Networks, S.L. Impartición

Curso en Madrid

Este programa está orientado a personas que quieran profundizar en los conceptos fundamentales y tecnologías involucradas en los proyectos de Big Data desde un punto de vista tecnológico, a través de las clases teóricas y prácticas, y así orientar su carrera profesional a esta área tecnológica.

Objetivos

En este curso se abarcarán aspectos relativos a administración, desarrollo y análisis de datos, empezando por fijar conocimientos sobre el entorno y ecosistema Apache Hadoop, desarrollo de aplicaciones y sobre Spark, extracción y preparación de datos así como nociones sobre principales bases de datos NoSQL del mercado, así como una introducción a las principales soluciones de Business Intelligence que se están aplicando en este contexto.

Requisitos

Experiencia básica en Linux y lenguajes de programación (Java y SQL) para máximo aprovechamiento.

Sedes

Madrid

Temario completo de este curso

Módulo 1. Introducción a las arquitecturas Big Data (10 h)

Introducción a las arquitecturas Big Data, las principales tecnologías y entidades que están liderando este tipo de plataformas, así como el uso que se está haciendo del Big Data en las compañías.


Módulo 2. Administración Linux (25 h)

Adquirir los conocimientos necesarios para el manejo y administración de servidores con sistema operativo Linux, desde su instalación y puesta en marcha, así como la configuración de los principales servicios, instalación de paquetes, automatización de tareas, revisión de los logs del sistema, configuración de usuarios y configuración de red.


Módulo 3. Cloudera Administrator Training for Apache Hadoop (25 h)

Esta formación de administrador de Cloudera para Apache Hadoop ofrece un conocimiento global de todas las medidas necesarias para operar y mantener un clúster Hadoop. Desde la instalación y la configuración a través de balanceo de carga y tuning, es la mejor preparación para los desafíos a los que se enfrentan los administradores de Hadoop.


Módulo 4. Programación (50 h)

Este módulo permitirá adquirir los conocimientos necesarios para la programación, desde las sintaxis hasta el modelo de programación orientado a objetos. Con este módulo, los alumnos aprenderán la base de la programación con clases y objetos, el desarrollo y uso de interfaces, control de errores, las principales APIs que componen los lenguajes de programación, sistema de entrada y salida de datos, a trabajar con el sistema de ficheros, funcionamiento de las conexiones de red y el desarrollo con multihilos.


Módulo 5. Cloudera Developer Training for Spark and Hadoop (25 h)

Este módulo ofrece los conceptos clave y la experiencia que necesitan los desarrolladores para desarrollar aplicaciones paralelas de alto rendimiento con Apache Spark 2.


Los participantes aprenderán cómo utilizar Spark SQL para hacer consultas de datos estructurados y Spark Streaming para realizar procesamiento en tiempo real sobre datos en transmisión desde una variedad de fuentes. También practicarán la escritura de aplicaciones que usan core Spark para realizar el procesamiento de ETL y algoritmos iterativos. El módulo cubre cómo trabajar con grandes conjuntos de agrupaciones de datos almacenados en un sistema de archivos distribuido y ejecutar aplicaciones Spark en un cluster Hadoop


Después de tomar esta formación, los participantes estarán preparados para enfrentar los desafíos del mundo real y construir aplicaciones para ejecutar decisiones más rápidas y mejores y análisis interactivos, aplicables a una amplia variedad de casos de uso, arquitecturas e industrias.


Módulo 6. Introducción a SQL (15 h)

A través de este módulo los alumnos aprenderán la sintaxis SQL para la realización de consultas contra base de datos, conocimiento que será necesario para el análisis de datos en plataformas de Big Data.


Módulo 7. Cloudera Data Analyst Training: Using Pig, Hive, and Impala (25 h)

Este módulo le enseñará a aplicar el análisis de datos tradicionales y habilidades de inteligencia de negocio para Big Data. Cloudera presenta los datos de las herramientas que los profesionales necesitan para acceder, manipular, transformar y analizar conjuntos de datos complejos utilizando SQL y lenguajes de scripting similares. Apache Hive hacen que los datos multi-estructurados sean accesibles a los analistas, administradores de bases de datos, y otras personas sin conocimientos de programación Java. Apache Pig aplica los fundamentos de lenguajes de scripting familiares para el clúster Hadoop. Cloudera Impala permite, en tiempo real, el análisis interactivo de los datos almacenados en Hadoop a través de un entorno de SQL nativo.


Módulo 8. Bases de Datos NoSQL: MongoDB (25 h)

MongoDB es una de las principales bases de datos NoSQL utilizadas actualmente en el mercado así como una de las de mayor distribución a nivel mundial.


Este módulo pretende desarrollar los conocimientos necesarios para que los alumnos sean capaces de desarrollar distintos tipos de aplicaciones haciendo uso de MongoDB así como desempeñar las tareas básicas de administración de esta base de datos.  Se explicará al participante los conceptos de instalación, configuración, ajuste de rendimiento, monitorización, así como copias de seguridad propias del rol de administrador así como los aspectos relativos a indexación, diseño de esquemas, manejo de drivers, etc. de la óptica del desarrollador.


Módulo 9. Proyecto Final (50 h)


Módulo 10. Preparación para Certificación oficial de Cloudera: Cloudera Certified Associate (CCA) Spark and Hadoop Developer (50 h)

Ver más

Más cursos relacionados de Informática >> otros

ESNECA BUSINESS SCHOOL

Máster en big data + máster en innovación tecnológica

ESNECA BUSINESS SCHOOL - Máster online
procedimientos de publicación y distribución utilizando aplicaciones informáticas UNIDAD DIDÁCTICA 9. Sistemas de almacén de datos (data warehouse) en sistemas erp
Precio Lectiva

2.000 € 1.400 
SELECT BUSINESS SCHOOL

Máster en Business Intelligence y Big Data

SELECT BUSINESS SCHOOL - Máster a distancia
Módulo 1: Datos y CRM Unidad Formativa 1. Instalación de sistemas operativos y gestores de datos en sistemas ERP-CRM Unidad Formativa 2. Instalación y
Precio Lectiva

3.880 € 1.940 
Universidad Internacional de Valencia (VIU) - UPC

Máster en Seguridad Informática (UPC - VIU)

Universidad Internacional de Valencia (VIU) - UPC - Máster online
Auditoría de sistemas-Hacking ético Monitorización de eventos de seguridad Data Driven Security Entornos Ubicuos: SCADA Móviles Respuesta

Precio a consultar
Universidad Internacional de Valencia (VIU)

Máster en Big Data y Data Science

Universidad Internacional de Valencia (VIU) - Máster online
MÓDULO 1: BIG DATA (15 ECTS) Sistemas y tecnologías para la gestión de la información en entornos Big Data Métodos para extracción, procesamiento

Precio a consultar
UNIVERSIDAD EUROPEA DE MADRID

Postgrado de Experto en Data Science.

UNIVERSIDAD EUROPEA DE MADRID - Postgrado en Villaviciosa De Odon (Madrid)
MODULO I. Obtención y manejo de datos (48 horas) Inicios de programación con R y Python Obtención de datos: formatos, APIS, Open Data Tratamiento

4.800 
Ver más