¿Te ayudamos? 900 49 47 47

Curso subvencionado para desempleados de Analista de Datos Big Data - Cloudera

Curso subvencionado para desempleados en Barcelona (Barcelona)

PUE

TExto no se de donde sale

foto del centro
foto del centro foto del centro foto del centro foto del centro
Ubicacion

Ciudad (Provincia) Calle Ver mapa Como llegar

  • Gratuito para desempleados
  • Semipresencial en Barcelona
  • PUE
  • Duración: 6 semanas

Se imparte en Barcelona y Madrid

Resumen

El curso se centra en Apache Pig, Apache Hive y Cloudera Impala, y tiene como objetivo enseñar a los alumnos a aplicar análisis de datos tradicionales y obtener la habilidad de gestionar las herramientas de inteligencia de negocio para el Big Data. Cloudera presenta los datos de las herramientas que los profesionales necesitan para acceder, manipular, transformar y analizar conjuntos de datos complejos utilizando SQL y lenguajes de scripting similares. Apache Hive hace que los datos multi-estructurados sean accesibles a para los analistas, administradores de bases de datos, y otras personas sin conocimientos de programación Java. Apache Pig aplica los fundamentos de lenguajes de scripting familiares para el cluster Hadoop. Cloudera Impala permite, en tiempo real, el análisis interactivo de los datos almacenados en Hadoop a través de un entorno de SQL nativo. PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera. PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales. El curso se imparte en modalidad mixta, combinando sesiones presenciales (175h) con formación online (55h) para facilitar un aprendizaje flexible y adaptado a los ritmos y disponibilidad de cada alumno.

Objetivos: Al finalizar la formación, el participante sabrá: Las características que Pig, Hive e Impala ofrecen para la adquisición, almacenamiento y análisis de datos. Fundamentos de Apache Hadoop y datos ETL (extracción, transformación y carga), entrada y procesamiento con herramientas Hadoop. Cómo Pig, Hive e Impala mejoran la productividad para tareas típicas de análisis. Unión de múltiples conjuntos de datos y análisis de datos dispares con Pig. Organizar datos en tablas, realizar transformaciones y simplificar complejas queries con Hive. Realizar de consultas complejas en tiempo real en conjuntos de datos.

A quién va dirigido: Curso dirigido a analistas de datos, especialistas en inteligencia de negocio, desarrolladores, arquitectos de sistemas y administradores de bases de datos. Se requieren conocimientos de SQL y estar familiarizado con comandos de Linux. Aunque no es obligatorio, se recomienda el manejo de algún lenguaje de scripting (Bash scripting, Perl, Python, Ruby). No son necesarios conocimientos de Hadoop.

Sedes

Barcelona, Madrid

Temario completo de este curso

MÓDULO 1: FUNDAMENTOS DE SQL

  • Introducción
  • Base de datos básica
  • Estructura de base de datos
  • El uso de SQL
  • Creación de una base de datos
  • Las consultas básicas
  • Mantenimiento de la Base de datos
  • Copia de tablas y modificaciones de columnas
  • Índices y restricciones
  • Eliminar o modificar filas de la tabla de datos
  • Funciones: uso y tipos
  • Funciones específicas
  • Joins
  • Exportación de datos, consultas y utilidades
  • Importación de datos y de archivos de datos
  • Importación con sentencias y utilidades
  • Subconsultas generales y básicas
  • Subconsulta no correlacionada y correlacionada
  • Tipos de subconsultas
  • Modificación de la tabla con subconsultas
  • Motores de almacenamiento
  • Creación de Vistas
  • Transacciones
  • Recuperación de Metadatos
  • Conclusiones

MÓDULO 2: FUNDAMENTOS DE CLOUDERA APACHE HADOOP

  • Acerca de Apache Hadoop
  • Acerca de Cloudera
  • La motivación para Hadoop
  • Problemas con los sistemas tradicionales de gran escala
  • Cómo Hadoop aborda estos desafíos
  • HDFS: El sistema de ficheros distribuidos de Hadoop
  • El funcionamiento de MapReduce
  • Anatomía de un clúster Hadoop
  • Aplicaciones comunes y usos especiales de la solución Hadoop
  • El ecosistema Hadoop
  • Almacenamiento de datos: Hbase
  • Integración de datos: Flume y Sqoop
  • Procesamiento de datos: Spark
  • Análisis de los datos: Hive, Pig e Impala
  • Exploración de datos: Cloudera Search
  • Integración de Hadoop en el CPD
  • Herramientas para gestionar Hadoop
  • Planificación del proyecto

MÓDULO 3: ANALISTA DE DATOS CLOUDERA

  • Introducción
  • Fundamentos Hadoop
  • Introducción a Pig
  • Análisis de datos básico con Pig
  • Procesado de datos complejos con Pig
  • Operaciones con multiconjuntos de datos con Pig
  • Troubleshooting y optimización de Pig
  • Introducción a Hive e Impala
  • Consultas con Hive e Impala
  • Administración de datos
  • Almacenamiento y datos de rendimiento
  • Análisis de datos relacional con Hive e Impala
  • Trabajar con Impala
  • Analizando texto y datos complejos con Hive
  • Optimización Hive
  • Extensión de Hive
  • Elección de la mejor opción
  • Conclusión

MÓDULO 4: PRÁCTICAS NO LABORALES (superada satisfactoriamente la formación)

Ver más ...

Curso subvencionado para desempleados de Analista de Datos Big Data - Cloudera

Curso subvencionado para desempleados en Barcelona (Barcelona)

Sedes

Barcelona, Madrid

PUE

El curso se centra en Apache Pig, Apache Hive y Cloudera Impala, y tiene como objetivo enseñar a los alumnos a aplicar análisis de datos tradicionales y obtener la habilidad de gestionar las herramientas de inteligencia de negocio para el Big Data. Cloudera presenta los datos de las herramientas que los profesionales necesitan para acceder, manipular, transformar y analizar conjuntos de datos complejos utilizando SQL y lenguajes de scripting similares. Apache Hive hace que los datos multi-estructurados sean accesibles a para los analistas, administradores de bases de datos, y otras personas sin conocimientos de programación Java. Apache Pig aplica los fundamentos de lenguajes de scripting familiares para el cluster Hadoop. Cloudera Impala permite, en tiempo real, el análisis interactivo de los datos almacenados en Hadoop a través de un entorno de SQL nativo. PUE es Training Partner oficial de Cloudera, autorizado por dicha multinacional para impartir formación oficial en tecnologías Cloudera. PUE está también acreditado y reconocido para realizar servicios de consultoría y mentoring en la implementación de soluciones Cloudera en el ámbito empresarial con el consiguiente valor añadido en el enfoque práctico y de negocio del conocimiento que se traslada en sus cursos oficiales. El curso se imparte en modalidad mixta, combinando sesiones presenciales (175h) con formación online (55h) para facilitar un aprendizaje flexible y adaptado a los ritmos y disponibilidad de cada alumno.

Objetivos: Al finalizar la formación, el participante sabrá: Las características que Pig, Hive e Impala ofrecen para la adquisición, almacenamiento y análisis de datos. Fundamentos de Apache Hadoop y datos ETL (extracción, transformación y carga), entrada y procesamiento con herramientas Hadoop. Cómo Pig, Hive e Impala mejoran la productividad para tareas típicas de análisis. Unión de múltiples conjuntos de datos y análisis de datos dispares con Pig. Organizar datos en tablas, realizar transformaciones y simplificar complejas queries con Hive. Realizar de consultas complejas en tiempo real en conjuntos de datos.

A quién va dirigido: Curso dirigido a analistas de datos, especialistas en inteligencia de negocio, desarrolladores, arquitectos de sistemas y administradores de bases de datos. Se requieren conocimientos de SQL y estar familiarizado con comandos de Linux. Aunque no es obligatorio, se recomienda el manejo de algún lenguaje de scripting (Bash scripting, Perl, Python, Ruby). No son necesarios conocimientos de Hadoop.

Gratuito para desempleados

Información adicional

Duración: 6 semanas

Temario completo de este curso

MÓDULO 1: FUNDAMENTOS DE SQL

  • Introducción
  • Base de datos básica
  • Estructura de base de datos
  • El uso de SQL
  • Creación de una base de datos
  • Las consultas básicas
  • Mantenimiento de la Base de datos
  • Copia de tablas y modificaciones de columnas
  • Índices y restricciones
  • Eliminar o modificar filas de la tabla de datos
  • Funciones: uso y tipos
  • Funciones específicas
  • Joins
  • Exportación de datos, consultas y utilidades
  • Importación de datos y de archivos de datos
  • Importación con sentencias y utilidades
  • Subconsultas generales y básicas
  • Subconsulta no correlacionada y correlacionada
  • Tipos de subconsultas
  • Modificación de la tabla con subconsultas
  • Motores de almacenamiento
  • Creación de Vistas
  • Transacciones
  • Recuperación de Metadatos
  • Conclusiones

MÓDULO 2: FUNDAMENTOS DE CLOUDERA APACHE HADOOP

  • Acerca de Apache Hadoop
  • Acerca de Cloudera
  • La motivación para Hadoop
  • Problemas con los sistemas tradicionales de gran escala
  • Cómo Hadoop aborda estos desafíos
  • HDFS: El sistema de ficheros distribuidos de Hadoop
  • El funcionamiento de MapReduce
  • Anatomía de un clúster Hadoop
  • Aplicaciones comunes y usos especiales de la solución Hadoop
  • El ecosistema Hadoop
  • Almacenamiento de datos: Hbase
  • Integración de datos: Flume y Sqoop
  • Procesamiento de datos: Spark
  • Análisis de los datos: Hive, Pig e Impala
  • Exploración de datos: Cloudera Search
  • Integración de Hadoop en el CPD
  • Herramientas para gestionar Hadoop
  • Planificación del proyecto

MÓDULO 3: ANALISTA DE DATOS CLOUDERA

  • Introducción
  • Fundamentos Hadoop
  • Introducción a Pig
  • Análisis de datos básico con Pig
  • Procesado de datos complejos con Pig
  • Operaciones con multiconjuntos de datos con Pig
  • Troubleshooting y optimización de Pig
  • Introducción a Hive e Impala
  • Consultas con Hive e Impala
  • Administración de datos
  • Almacenamiento y datos de rendimiento
  • Análisis de datos relacional con Hive e Impala
  • Trabajar con Impala
  • Analizando texto y datos complejos con Hive
  • Optimización Hive
  • Extensión de Hive
  • Elección de la mejor opción
  • Conclusión

MÓDULO 4: PRÁCTICAS NO LABORALES (superada satisfactoriamente la formación)

 
ver temario completo
 

Preguntas a exalumnos

Más cursos relacionados de Informática y tecnología

  •  EXES

    Objetivos: Se pretende conseguir que el alumno obtenga unos conocimientos muy avanzados de los distintos componentes del lenguaje ORACLE. Además en este curso, los participantes aprenderán las ...

  •  EXES

    Master Certificado Elite® Experto Oracle 12c (Online)

    Máster bonificable online 1.797 € EXES

    Objetivos: El objetivo del Master Certificado Élite Experto es que todos nuestros alumnos alcancen unos conocimientos técnicos avanzados en la BBDD ORACLE 12c. Que les permita acceder a un puesto de ...

  •  EXES

    Objetivos: El objetivo del Master Certificado Élite Experto es que todos nuestros alumnos alcancen unos conocimientos técnicos avanzados en la BBDD ORACLE 12c, que les permita acceder a un puesto de ...

  •  EXES

    Objetivos: El objetivo del Master Certificado Élite es que todos nuestros alumnos alcancen unos conocimientos técnicos avanzados en la BBDD ORACLE (Estructura y Business Intelligence), que les ...

  •  EXES

    El objetivo del Curso Especialista es que todos nuestros alumnos alcancen unos conocimientos técnicos en la administración de Oracle, etc.

  •  EXES

    El objetivo del Curso Especialista es que todos nuestros alumnos alcancen unos conocimientos técnicos en el Business Intelligence con OBI, etc. que les permita acceder a un puesto de trabajo en el ...

  •  INTECSSA

    Master Certificado en Administración Avanzada de Oracle 11g

    Máster bonificable online 1.100 € INTECSSA

    Objetivos: El Instituto Inertia de Sistemas y Software Avanzado (INTECSSA) le prepara para obtener las certificaciones oficiales de Administración Oracle 11g. Después de obtener el grado de OCA, es ...

Llamar gratis
Llamar gratis