Curso online
Duración : 2 Meses
El Curso Superior en Tecnologías de Almacenamiento para Big Data de IEAD – Instituto Europeo de Alta Dirección es un programa de formación que cubre los principales aspectos relacionados con el almacenamiento de grandes cantidades de datos. Los participantes aprenderán sobre diferentes tecnologías de almacenamiento, tales como sistemas de archivos distribuidos, bases de datos NoSQL, almacenamiento en la nube, entre otros.
Los Cursos Superiores de IEAD – Instituto Europeo de Alta Dirección han sido diseñados para que los directivos puedan potenciar sus capacidades profesionales y dispongan de las herramientas y las últimas tendencias en gestión, liderazgo y organización. Los Cursos Superiores ofrecen una visión práctica en la gestión y los entornos organizacionales.
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Objetivos
Conocer las tecnologías de almacenamiento utilizadas para Big Data. Aprender a seleccionar la tecnología de almacenamiento más adecuada para cada caso de uso. Familiarizarse con los sistemas de archivos distribuidos y las bases de datos NoSQL. Comprender los conceptos de escalabilidad y disponibilidad en el almacenamiento de datos a gran escala. Adquirir conocimientos sobre el almacenamiento en la nube y las soluciones de almacenamiento disponibles.
Temario completo de este curso
TEMA 1. APACHE HADOOP
1.1. ¿Qué es Hadoop?
1.2. Distribuciones Hadoop
TEMA 2. EL ECOSISTEMA HADOOP
2.1. ¿Qué es el ecosistema Hadoop?
2.2. Descripción de las aplicaciones del ecosistema Hadoop
TEMA 3. APACHE SPARK
3.1. ¿Qué es apache Spark
3.2. Introducción a Scala
3.3. Spark con Scala con dataframes
3.4. Datasets con Scala
3.5. Spark SQL y dataframes
3.6. Spark SQL y conexiones a fuentes externas
3.7. Spark con Python
3.8. Optimización de aplicaciones en Spark
TEMA 4. TECNOLOGÍAS PARA STREAMING
4.1. Conceptos de batch y streaming
4.2. Apache Kafka
4.3. Apache Kafka y Apache Spark
4.4. Streaming en la nube
TEMA 5. SISTEMAS DE FICHEROS Y PLATAFORMAS PARA BIG DATA EN CLOUD
5.1. Organización del dato: Data Lake
5.2. Plataformas en la nube
5.3. Plataformas de big data como servicio en la nube
5.4. Sistemas de almacenamiento en la nube