¿Quieres aprender a desplegar sistemas de gestión de datos en la nube mediante ETLs? ¿Tienes conocimientos en el campo del análisis de datos o el machine learning y quieres conocer cómo desplegar sistemas de consumo de datos en producción? ¿No te sientes suficientemente confiado en tus habilidades de programación para crear tus propios sets de datos?
Si la respuesta a alguna de estas preguntas es sí, entonces este curso es para ti. La proliferación exponencial de nuevos tipos de fuentes de datos y el ritmo de generación de los mismos son probablemente los factores clave detrás del auge de toda la innovación que conlleva el Big Data y el análisis de datos en general. Por eso, como profesionales en este sector, no solo es importante tener la capacidad de generar y entrenar modelos, sino aprender a desarrollar sistemas que puedan generar para nosotros nuestros propios sets de datos.
Sin embargo, aun teniendo acceso a cantidades brutales de datos, estos no siempre son ni fácilmente accesibles ni suelen estar en los formatos ni estándares de calidad que deseamos. Nuestra misión será dotarte de conocimientos y herramientas para poder afrontar estos escenarios con éxito.
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Objetivos
- Implementar ETLs en Python con un framework híbrido (cloud-local) para su automatización. - Realizar tratamiento y obtención de datos desde texto mediante expresiones regulares (RegEx). - Descubrir un método que te servirá al abordar proyectos de obtención, transformación y carga de datos de forma profesional. - Crear y desplegar recursos cloud en un proveedor híperescalar para alojar tus propios datos en la nube. - Inyectar y extraer datos desde bases de datos SQL mediante Python. - Obtener datos con Python desde múltiples tecnologías como APIs REST, ficheros JSON o bases de datos SQL. - Desarrollar procesos de obtención de datos desde páginas web mediante web scraping en Python. - Conocer la metodología y código para asegurarnos de que nuestros datos tienen la forma, estructura y calidad que deseamos para nuestros análisis. - Desarrollar una base de datos destinada para el análisis de datos estructurados.
A quién va dirigido
Estudiantes de ciencia de datos o ingeniería de datos que buscan aprender a construir pipelines de datos eficientes utilizando Python para gestionar grandes cantidades de información provenientes de múltiples fuentes. Estudiantes de ingeniería de software o desarrollador backend que quieren mejorar sus habilidades en la creación de soluciones automatizadas para la integración de datos entre sistemas. Analistas de negocios o especialistas en inteligencia de negocios (BI) interesados en aprender a automatizar los procesos de recolección, transformación y carga de datos para alimentar sistemas de inteligencia de negocios.
Requisitos
Tener conocimiento básico de Python para análisis de datos, aunque en el curso haremos un repaso introductorio. Haber cursado previamente el curso de Python de la A a la Z o similar para empezar con buena base sobre el lenguaje de programación. Tener un ordenador con conexión a internet y con cualquier sistema operativo instalado y saber utilizarlo a nivel básico de usuario. ¡Tener muchas ganas de aprender y usar Python como un profesional para el mundo Cloud!
Temario completo de este curso
Módulo 1. Introducción
Unidad didáctica 1. Introducción general
Unidad didáctica 2. Introducción a las ETLs
Módulo 2. Presentación del caso
Unidad didáctica 3. Presentando el caso
Módulo 3. Prefect
Unidad didáctica 4. Introducción a prefect
Unidad didáctica 5. Prefect Core I
Unidad didáctica 6. Prefect Core II
Unidad didáctica 7. Prefect cloud
Bonus i. Expresiones regulares
Bonus ii. Web scraping
Módulo 4. El caso
Unidad didáctica 8. Tu caja de herramientas para el caso
Unidad didáctica 9. Desarrollo y resolución del caso