¿Qué quieres aprender?

Curso Superior en Tecnologías de Almacenamiento para Big Data

Curso Superior en Tecnologías de Almacenamiento para Big Data

ENEB - Escuela de Negocios Europea de Barcelona

Curso online


299

Duración : 1 Mes

¿Quieres hablar con un asesor sobre este curso?

Objetivos

- Entender la arquitectura de sistemas de almacenamiento distribuido para Big Data. - Aprender sobre bases de datos NoSQL y tecnologías de procesamiento de datos en tiempo real. - Conocer los diferentes sistemas de archivos distribuidos utilizados para el almacenamiento de Big Data. - Familiarizarse con herramientas de gestión de datos como Hadoop y Spark. - Adquirir habilidades prácticas para la gestión y el procesamiento de grandes cantidades de datos.

A quién va dirigido

- El curso está dirigido a profesionales que deseen profundizar en el campo de Big Data y su gestión de datos. - Profesionales que trabajan en áreas relacionadas con la informática y la gestión de datos. - Perfiles profesionales como son ingenieros de software, científicos de datos, administradores de bases de datos, ingenieros de infraestructura. - Cualquier persona interesada en aprender sobre tecnologías de almacenamiento de Big Data.

Requisitos

El curso está dirigido a profesionales que deseen profundizar en el campo de Big Data y su gestión de datos. Profesionales que trabajan en áreas relacionadas con la informática y la gestión de datos. Perfiles profesionales como son ingenieros de software, científicos de datos, administradores de bases de datos, ingenieros de infraestructura. Cualquier persona interesada en aprender sobre tecnologías de almacenamiento de Big Data.manera efectiva.

Temario completo de este curso

TEMA 1. APACHE HADOOP

1.1. ¿Qué es Hadoop?

1.2. Distribuciones Hadoop

TEMA 2. EL ECOSISTEMA HADOOP

2.1. ¿Qué es el ecosistema Hadoop?

2.2. Descripción de las aplicaciones del ecosistema Hadoop

TEMA 3. APACHE SPARK

3.1. ¿Qué es Apache Spark?

3.2. Introducción a Scala

3.3. Spark con Scala con dataframes

3.4. Datasets con Scala

3.5. Spark SQL y Dataframes

3.6. Spark SQL y conexiones a fuentes externas

3.7. Spark con Python

3.8. Optimización de aplicaciones en Spark

TEMA 4. TECNOLOGÍAS PARA STREAMING

4.1. Conceptos de batch y streaming

4.2. Apache Kafka

4.3. Apache Kafka y apache Spark

4.4. Streaming en la nube

TEMA 5. SISTEMAS DE FICHEROS Y PLATAFORMAS PARA BIG DATA EN CLOUD

5.1. Organización del dato: Data Lake

5.2. Plataformas en la nube

5.3. Plataformas de big data como servicio en la nube

5.4. Sistemas de almacenamiento en la nube

Ver más