Curso subvencionado presencial
Madrid
Duración : 50 Días
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Sedes
Localización
Fecha inicio
Objetivos
El objetivo principal es que obtengas una serie de habilidades y conocimientos que te permitan tratar datos de gran volumen y complejidad y extraer información de los mismos, mediante una solución Big Data de código abierto como Cloudera.
A quién va dirigido
Desempleados, trabajadores y personas afectadas por ERTE.
Requisitos
Asignación de plaza sujeta a previa comprobación del sector empresarial.
Temario completo de este curso
En este apartado encontrarás el temario del curso:
MÓDULO 1: FUNDAMENTOS DE SQL
- Introducción
- Base de datos básica
- Estructura de base de datos
- El uso de SQL
- Creación de una base de datos
- Las consultas básicas
- Mantenimiento de la Base de datos
- Copia de tablas y modificaciones de columnas
- Índices y restricciones
- Eliminar o modificar filas de la tabla de datos
- Funciones: uso y tipos - Funciones específicas
- Joins
- Exportación de datos, consultas y utilidades
- Importación de datos y de archivos de datos
- Importación con sentencias y utilidades
- Subconsultas generales y básicas
- Subconsulta no correlacionada y correlacionada
- Tipos de subconsultas
- Modificación de la tabla con subconsultas
- Motores de almacenamiento
- Creación de Vistas
- Transacciones
- Recuperación de Metadatos
- Conclusiones
MÓDULO 2: FUNDAMENTOS DE CLOUDERA APACHE HADOOP
- Acerca de Apache Hadoop
- Acerca de Cloudera
- La motivación para Hadoop
- Problemas con los sistemas tradicionales de gran escala
- Cómo Hadoop aborda estos desafíos
- HDFS: El sistema de ficheros distribuidos de Hadoop
- El funcionamiento de MapReduce
- Anatomía de un cluster Hadoop
- Aplicaciones comunes y usos especiales de la solución Hadoop
- El ecosistema Hadoop
- Almacenamiento de datos: Hbase
- Integración de datos: Flume y Sqoop
- Procesamiento de datos: Spark
- Análisis de los datos: Hive, Pig e Impala
- Exploración de datos: Cloudera Search
- Integración de Hadoop en el CPD
- Herramientas para gestionar Hadoop
- Planificación del proyecto
MÓDULO 3: ANALISTA DE DATOS CLOUDERA
- Introducción
- Fundamentos Hadoop
- Introducción a Pig
- Análisis de datos básico con Pig
- Procesado de datos complejos con Pig
- Operaciones con multiconjuntos de datos con Pig
- Troubleshooting y optimización de Pig
- Introducción a Hive e Impala
- Consultas con Hive e Impala
- Administración de datos
- Almacenamiento y datos de rendimiento
- Análisis de datos relacional con Hive e Impala
- Trabajar con Impala
- Analizando texto y datos complejos con Hive
- Optimización Hive
- Extensión de Hive
- Elección de la mejor opción
- Conclusión