¿Qué quieres aprender?

Administrador Big Data - Cloudera

Administrador Big Data - Cloudera

PUE

Curso subvencionado para desempleados semipresencial

Barcelona y 1 más


Gratis

Duración : 6 Semanas

El curso de administrador de Cloudera para Apache Hadoop ofrece un conocimiento global de todas las medidas necesarias para operar y mantener un clúster Hadoop. Desde la instalación y la configuración a través de balanceo de carga y tuning, es la mejor preparación para los desafíos del mundo real que enfrentan por los administradores de Hadoop.

PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera.

PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales.

El curso se imparte en modalidad mixta, combinando sesiones presenciales (175h) con formación online (55h) para facilitar un aprendizaje flexible y adaptado a los ritmos y disponibilidad de cada alumno.

¿Quieres hablar con un asesor sobre este curso?

Sedes

Localización

Fecha inicio

Barcelona
Madrid

Objetivos

Al finalizar la formación, el participante sabrá: Funciones de Cloudera Manager que facilitan la gestión de clústeres, agregación de logs, gestión de configuración, administración de recursos, informes, alertas y administración de servicios. Fundamentos de la arquitectura de YARN, MapReduce, Spark y HDFS. Determinar el hardware y la infraestructura correctos para el clúster. Configuración y despliegue del clúster necesarios para integrarlo en el data center. Cómo cargar datos en el clúster desde archivos generados dinámicamente mediante Flume y desde RDBMS utilizando Sqoop. Configurar FairScheduler para proporcionar acuerdos de nivel de servicio para varios usuarios de un clúster. Mejores prácticas para preparar y mantener Apache Hadoop en producción. Trouleshooting, diagnóstico, tinning y resolución de problemas en Hadoop.

A quién va dirigido

El curso oficial se dirige a Administradores de Sistemas y a todo personal que sea responsable de la gestión de clústers Apache Hadoop en entornos de Producción o Desarrollo. Esta formación oficial está diseñada para personas con un nivel básico de conocimientos en la administración de sistemas Linux. No es necesario tener un conocimiento previo de Hadoop.

Temario completo de este curso

MÓDULO 1: FUNDAMENTOS UNIX y LINUX

  • Visualización de directorios y archivos
  • Trabajo con archivos y directorios de Solaris
  • Uso del editor vi
  • Uso de comandos en el Shell
  • Uso de los permisos de archivos básicos
  • Configuración las listas de control de acceso (ACL)
  • Búsqueda de archivos y directorios
  • Control básico de los procesos
  • Funcionalidad avanzada de shell
  • Lectura de secuencias de comandos de shell
  • Creación de Archivos
  • Compresión, visualización y descompresión de archivos
  • Conexiones remotas y transferencias de archivos
  • Troubleshooting

MÓDULO 2: ADMINISTRACIÓN DE SISTEMAS LINUX

  • Introducción a Linux
  • Instalación de Linux
  • Linux Boot Process
  • Configuración del Sistema
  • Gestión de paquetes
  • Automatización de tareas
  • Logging y acceso al sistema
  • Configuración del módulo del kernel
  • Administración de usuarios y grupos
  • Sistemas de archivos
  • Administración de Almacenamiento
  • Configuración de la red
  • Direccionamiento de red y servicios de nombres
  • Intercambio de archivos
  • Servicio de OpenSSH
  • Autenticación y Directorio de Servicios
  • Módulos de autenticación conectables (PAM)
  • Administración de la Seguridad
  • Web y servicios de correo electrónico
  • Supervisión del sistema y solución de problemas
  • Troubleshooting

MÓDULO 3: ADMINISTRACIÓN CLOUDERA PARA APACHE HADOOP

  • Introducción
  • Historia de Apache Hadoop
  • Instalación del Clúster Hadoop
  • El Hadoop Distributed File System (HDFS)
  • MapReduce y Spark en YARN
  • Configuración de Hadoop y registros de Daemon
  • Obtención de datos en HDFS
  • Planificación de un cluster Hadoop
  • Instalación y configuración de Hive, Pig e Impala
  • Clientes Hadoop incluidos en Hue
  • Configuración avanzada de un cluster
  • Seguridad Hadoop
  • Gestión de recursos
  • Mantenimiento de un cluster
  • Solución de problemas y monitorización de un cluster
  • Conclusión

MÓDULO 4: PRÁCTICAS NO LABORALES (superada satisfactoriamente la formación)

Ver más