¿Qué quieres aprender?

Big Data + Especialización en Business Intelligence y Especialización en Hadoop

Big Data + Especialización en Business Intelligence y Especialización en Hadoop

Tokio School

Curso online


2001-3000 €

Con el curso online de Big Data de Tokio School te prepararás para trabajar como arquitecto de datos, data scientist, data consultant o big data developer (entre otras profesiones).

Podrás especializarte en Apache Hadoop y Business Intelligence entre otras opciones y alucinar con las oportunidades que crecen cada día para quien está dispuesto a formarse en este sector. Ejerce como científico, ingeniero, analista o arquitecto Big Data entre otras salidas profesionales para especialistas del dato.

¿Quieres hablar con un asesor sobre este curso?

Objetivos

En el curso de Big Data te adentrarás en el mundo de la programación, su ecosistema y cómo utilizarlo para la resolución de problemas. Además, te enseñaremos a visualizar e interpretar la información de una manera correcta aplicando diferentes técnicas para la explotación de datos. ¿El objetivo? Ser capaz de preparar proyectos orientados al Big Data de principio a fin. Y para todo ello utilizarás las herramientas de los profesionales: Databricks, Python, Spark, SQL, Hadoop…

Temario completo de este curso

Módulo 0: Introducción a la Programación
Unidad 1. Introducción a Python
● Python el nuevo desconocido
● Gráficas estadísticas
● Programación con R
● Manipulación de datos
● Programación orientada a objetos y excepciones
● Estadística bidimensional
● Regresión lineal
● Características básicas del lenguaje
● Principales parámetros estadísticos
● Medidas descriptivas
Unidad 2: Introducción a la Estadística
Unidad 3: Introducción a R
● Tabla de frecuencias
● Gráficos estadísticos con R
● Variables estadísticas
● Manejo de datos
Unidad 4: Introducción a SQL
● Estructura básica de una consulta en SQL
● Funciones de agregación en SQL
● Consultas SQL sobre más de una tabla
● Tipos de consultas en SQL
Modulo 1: Introducción al Big Data
Unidad 1: Ecosistema Big Data
● Definición de componentes y arquitectura
● Introducción a Hadoop y MapReduce
● Disponibilidad, escalabilidad y resiliencia
Unidad 2: Estrategias basadas en datos
● Business Intelligence vs. Big Data
● Cuadros de mando (Dashboards)
Unidad 3: Entornos de procesamiento
● Cloud Computing
Unidad 4: Casos de uso de Big Data: ejemplos en la industria
● Internet de las Cosas (IoT)
Módulo 2. El dato y su ciclo de vida
Unidad 1: Datos
● Calidad del dato
● El dato
● Derechos sobre los datos
Unidad 2: Ciclo de vida del dato
● Fuentes de datos
● Extracción, Tratamiento y Carga
● Análisis para la explotación
● Almacenamiento de datos
● Visualización y storytelling para la explotación
● Tipo de escalabilidad
La selección de los elementos visuales
Escalabilidad vertical
Escalabilidad horizontal
● Toma de decisiones
Módulo 3. Almacenamiento escalable de datos
Unidad 1: Bases de datos distribuidas
● Bases de datos no distribuidas
Unidad 3: NoSQL – Clave valor
Unidad 2: NoSQL
Unidad 4: NoSQL – Columnares
Unidad 5: NoSQL – Orientada a documentos
Unidad 1: El ecosistema Hadoop
Unidad 6: NoSQL – Orientada a grafos
● Arquitectura
● Introducción a Hadoop
● Cassandra Query Languaje – CQL
● Modelado de datos en Casandra
● Herramientas del ecosistema Hadoop
● CQL – Creación de modelo de datos
● Teorema de CAP
● Bases de datos relacionales
Keyspace
Table
Módulo 4. Arquitectura Big Data
Unidad 2: Cluster y sistemas distribuidos (HDFS, MapReduce)
Unidad 3: Análisis de datos con Hive y Pig
Unidad 4: Procesamiento de datos con Spark
● Spark Streaming
● Spark RDD (Resilient Distributed Datsets)
● Spark SQL
Módulo 5. Análisis para la explotación de datos
Unidad 1: Perfiles de datos
● Ingeniero de datos
● Científicos de datos
Unidad 2: Análisis exploratorio de datos
● Distribución de los datos
● Estadística descriptiva
● Correlación
● Exploración de datos categóricos y binarios
● Exploración de 2 o más variables
Unidad 3: Técnicas de muestreo de datos
● Selección aleatoria
● Selección Bias
● Selección por distribución estadística
Unidad 4: Contraste de hipótesis
● Testeo de hipótesis
● Testeo de muestras A/B
● P-Value
● Significancia estadística y P-Value
Unidad 5: Regresión y predicción
● Regresión multilineal
● Regresión linear
● Predecir usando regresión
● Interpretar los resultados de una regresión
Unidad 6: Aprendizaje supervisado
● Algoritmos: árboles de decisión
● Conceptos
Unidad 7: Aprendizaje no supervisado
● Algoritmos: K-Means, clusters jerárquicos
● Componentes principales
Unidad 8: Introducción al Deep Learning
● Redes neuronales
● Conceptos fundamentales
Módulo 6. Presentación de proyectos Big Data y storytelling
Unidad 1: Presentación de un proyecto Big Data
● La audiencia y su importancia
● La importancia del contexto
Unidad 2: Componentes para la presentación de un proyecto Big Data
● Ideas de diseño
Módulo 1. Introducción al BI
Unidad 1: Historia y evolución del BI
● ¿Qué es el BI?
● Componentes BI
● Fuentes de información
Especialización Business Intelligence
Unidad 2: Conceptos básicos BI
● Herramientas/procesos básicos BI
Unidad 3: Modelado de datos
● Modelo en estrella
● Modelo copo de nieve
● Modelo multidimensional
Unidad 4: Aprovisionamiento de datos
● Datawarehouse
● Datamart
● Principales diferencias
Módulo 2. ETL e introducción a la visualización
Unidad 1: Procesos de extracción transformación
y cargas y herramientas.
● Diseño de proceso ETL
● Principales herramientas del mercado y particularidades
Unidad 2: Introducción a la visualización
● Introducción a la visualización de la información
● Beneficios de la visualización
● Categorías de la visualización
Unidad 3: Herramientas y particularidades
● Principales herramientas del mercado y comparativa
Módulo 3. Introducción al PowerBI
Unidad 1: Comprensión básica de PowerBI
Unidad 2: Conexión a orígenes de datos
● ¿Qué es?
● ¿Para qué sirve?
● Interfaz
Unidad 3: Editor Power Query
● Formateo de datos
● Detección de errores
● Pivot
Unidad 4: Creación de gráficos
Unidad 5: Construcción de informe con filtros
● Vinculación y desvinculación en gráficos
Unidad 6: Introducción a DAX (Data Analysis Expressions)
● Introducción a DAX
● Tablas y columnas calculadas, medidas simples
● Filtrado de filas y medidas avanzadas
Unidad 7: Creación de métricas y gráficos avanzados
Módulo 4. Introducción al Tableau: Visualización I
Unidad 1: Tableau I
Unidad 2: Tableau II
● Comprensión básica de Tableau
● Conexión a fuente/base de datos
● Combinación de datos
● Editar y guardar fuente de datos
● Dimensiónes y métricas
● Conversión tipo de datos
● Representación gráfica de los datos
● Filtrado de informes y características
● Creación jerarquías y drill down
Unidad 3: Tableau III
● Creación campos calculados. (medidas y dimensiones)
● Creación de parámetros
● Combinación campos calculados y parámetros
● Descripciones emergentes
Unidad 5. Tableau Avanzado: Visualización II
Unidad 1: Tableau avanzado I
● Creación de grupos
● Creación de conjuntos
● Expresiones LOD
Unidad 2: Tableau avanzado II
● Creación de dashboard
● Objetos dashboard
● Fomatos dashboard
● Interactividad dashboard
Unidad 3: Tableau avanzado III
● Extensiones Tableau
● Configuración extensión
● Gráficos no nativos
Unidad 4: Movilidad y colaboración
● Creación de historias
● Adaptación de informes para móvil y tablet
● Tableau online/Tableau server/Tableau public
Módulo 1. Introducción al Big Data
Unidad 1: Conceptos básicos
● Definición y conceptos
● Evolución de los datos
Especialización Apache Hadoop
Unidad 2: SQL vs. NoSQL
Unidad 3: Preparación entorno de trabajo
Módulo 2: Apache Hadoop (HDFS)
Unidad 1: Conceptos básicos y arquitectura
● Conceptos fundamentales
● Arquitectura Hadoop
Unidad 2: Lectura, escritura y replicación
Unidad 3: Permisos y borrado de datos
Unidad 4: Safemode, snapshots y gestión de caché
Unidad 5: Profundizando con la Shell
Módulo 3: Map reduce & yarn
Unidad 1: Map reduce: el algoritmo
● Arquitectura
● Configuración
Unidad 2: Implementación de algoritmos map reduce
Unidad 3: Maneras de ejecutar el algoritmo
Unidad 4: YARN: Arquitectura, gestión de colas y Zookeeper
Módulo 4: Ecosistema Hadoop
Unidad 1: Apache Hive
● Arquitectura
● Componentes
Unidad 2: Apache Sqoop
● Arquitectura
● Componentes
Unidad 5: Reporting con Zeppelin
● La importancia del reporting
● Creación de reportes con Zeppelin

Ver más