El Posgrado en Ingeniería de datos y Big data está conformado por las especializaciones siguientes:
- Bases de datos para entornos analíticos
- Big data y sistemas NoSQL
Semestre 1
E3. Bases de datos para entornos analíticos
En esta especialidad se adquieren las competencias para diseñar, construir, mantener y explotar los sistemas de información de inteligencia de negocio más habituales, es decir, los que se basan en el uso de bases de datos relacionales para la construcción de un almacén de datos o data warehouse.
Se compone de las siguientes asignaturas:
Diseño y construcción del data warehouse
En esta asignatura se aprende a crear un almacén de datos adecuado que ofrezca soporte en la toma de decisiones de la organización. Se presenta a nivel conceptual la arquitectura de almacenamiento de un sistema de BI para Data Warehousing y se dan pautas para la construcción de este tipo de sistemas. La puesta en práctica se lleva a cabo mediante la resolución de un caso práctico extenso para el cual se utilizan diferentes herramientas de Microsoft o Pentaho, sobre bases de datos Oracle o PostgreSQL.
Bases de datos para data warehouse
Esta asignatura tiene por objeto adquirir conceptos, procedimientos y buenas prácticas para la creación y manipulación de las bases de datos relacionales que dan soporte a la construcción del almacén de datos. Se profundiza en el aprendizaje del lenguaje SQL, y en el diseño físico de bases de datos, así como en bases de datos orientadas a columnas. Estas bases de datos se caracterizan por el almacenamiento de los datos en forma de columnas, a diferencia de las bases de datos relacionales tradicionales que realizan un almacenamiento de los datos por filas. Se trabaja con una base de datos relacional tipo PostgreSQL.
Explotación y administración del data warehouse
En esta asignatura se aprende a evaluar la viabilidad de la construcción de un almacén de datos y a explotar y administrar sistemas de Data Warehouse. Con este fin se presentan las distintas formas de presentar los datos y qué tipos de herramientas pueden ofrecer el tipo de visualización que interesa. Asimismo se enseña a administrar el sistema durante su desarrollo, implantación y/o posterior explotación de los datos. Se trabaja con la misma familia de herramientas: Microsoft o Pentaho para el almacén de datos y Oracle o PostgreSQL como bases de datos.
E4. Big data y sistemas NoSQL
En esta especialidad se adquieren las competencias para diseñar, construir, mantener y explotar los sistemas de información de inteligencia de negocio más nuevos, basados en la captura, procesamiento y gestión de datos masivos, de diferentes procedencias y tipología.
Se compone de las siguientes asignaturas:
Escenarios de uso de Big data
En esta asignatura se presentan distintos escenarios de negocio que combinan tanto la analítica de negocio como el big data, y cómo pueden ser utilizados para la creación de nuevos productos y servicios basados en los datos. Entre estos escenarios destacan la inteligencia geográfica, la analítica social o el paradigma de datos abiertos. Asimismo se presentan tecnologías no cubiertas en otras asignaturas como serían stream data o los sistemas de indexación y búsqueda distribuida. Por las características de la asignatura se trabaja con diferentes herramientas que se actualizan continuamente y pueden cambiar en cada edición y que incluyen R y GeoBI entre otros..
Tecnologías Big data: tecnologías
En esta asignatura se presentan las bases para el almacenamiento y procesamiento de datos masivos o big data. Veremos los principales modelos de procesamiento (batch y stream), así como los frameworks más utilizados en la actualidad (Apache Hadoop y Spark). De cada uno, presentaremos sus ecosistemas e introduciremos los módulos más relevantes para el acceso, proceso y visualización de datos, incluyendo análisis de datos, machine learning y manipulación de datos en formato de grafos. Se trabaja principalmente con el entorno de almacenamiento distribuido HDFS y con los frameworks de procesamiento Apache Hadoop y/o ApacheSpark sobre máquinas virtuales accesibles desde el aula.
Bases de datos NoSQL
Las bases de datos NoSQL constituyen una alternativa a las bases de datos relacionales y son especialmente idóneas para ciertos dominios de aplicación: dominios que trabajan con grandes volúmenes de datos, dominios donde se requiera una alta distribución y/o disponibilidad, dominios que trabajan con datos poco estructurados y dominios en los que se establecen múltiples y complejas interrelaciones entre los datos. En esta asignatura se presentan los principios y conceptos de este tipo de bases de datos, los modelos de datos que subyacen y los problemas que presenta la distribución en el almacenaje y gestión de los datos. Se trabajan diferentes tipos de bases de datos NoSQL (clave-valor, documentos, orientadas a columnas y grafos) con herramientas como Riak, MongoDB o Neo4j.