¿Qué quieres aprender?

Economía en la Era de Big Data: Retos Empíricos

Economía en la Era de Big Data: Retos Empíricos

Universidad de los Andes Educación Continuada

Curso online


760

Este curso introduce a los estudiantes a algunas de las aplicaciones más importantes de la minería de datos y el aprendizaje de máquinas (Big Data) a problemas empresariales y económicos. En particular, haremos bastante énfasis en los problemas empíricos que se enfrentan: La diferenciación entre predicción y causalidad y las implicaciones que esto tiene sobre la toma de decisiones, el problema de privacidad en la era de la información, los sesgos algorítmicos, discriminación, etc.Para esto los estudiantes serán introducidos muy rápidamente a los elementos más básicos del aprendizaje estadístico (i.e. riesgo, el problema de aprendizaje de máquinas, error de estimación y aproximación) y las principales técnicas: el modelo de regresión lineal, vecinos más cercanos, el modelo logístico, arboles y bosques aleatorios. Con este conjunto mínimo de herramientas tendremos los elementos necesarios para entender los problemas de predicción, causalidad, privacidad, sesgos algorítmicos y discriminación desde un punto de vista formal y aplicado a problemas reales.Además de aprender los fundamentos teóricos, los estudiantes aprenderán herramientas básicas de programación en Python, lo que les permitirá una vez finalizado el curso, hacer un trabajo final en el que se plantee un problema que utilice diversas fuentes de datos, aplicar las técnicas aprendidas en clase y ofrecer una solución novedosa. Este trabajo final podrá estar basado en problemas específicos del lugar de trabajo de los estudiantes, tesis o intereses particulares.

¿Quieres hablar con un asesor sobre este curso?

Temario completo de este curso

Contenido 1. Teoría:Fundamentación estadística del aprendizaje de máquinas y la minería de datos.Métodos Lineales de clasificación (regresión lineal, modelo logístico).Aplicación: Breve introducción al Aprendizaje de máquinas en economía: predicción vs. causalidad.Práctica:Introducción a Python I2. Teoría:Selección y validación de modelos: Regularización, validación cruzada, (sub) bagging, boosting, curva ROC.Métodos no lineales: árboles, bosques aleatorios, kernels.Aplicación: Discriminación, riesgo de crédito y riesgo moralPráctica:Introducción a Python II3. TeoríaPredicción, Causalidad y toma de decisionesAplicación:Predicción del gasto público en salud y toma de decisiones al interior de una empresa de servicios públicos domiciliariosPráctica:Ejemplos de estimación de efectos causales en Python (A/B testing)4. Teoría:Definiciones formales de discriminación algorítmica y como mitigarlaAplicación:Predicción de crimenPráctica:Prueba de calibración y mitigación de discriminación algorítmica en Python5. Teoría:Definiciones formales de privacidad: differential privacyAplicación:Entrenando un modelo con descenso del gradiente y local differential privacy6. Teoría:Medición, Macroeconomía y las grandes oportunidades de BigData-Data Diseñada y Data Orgánica-Pilares de las mediciones futuras-Debilidades y retos de Big Data7. Teoría:Problemas de Identificación en Macroeconomía: Soluciones Preliminares8. Teoría:Soluciones Parte II. Aplicaciones: Problema de atribución y Problema de Contagio9. Teoría:Uniendo Big Data y Econometría. ¿Qué puede aprender cada uno del otro?10. Aplicaciones:Medición de Estrés, Discriminación, Tráfico Humano, Consumo de Drogas, e Impacto Ambiental Metodología: Este curso es muy práctico y requiere de la participación intensa de los estudiantes para su desarrollo. Las clases magistrales tendrán una duración de tres horas complementadas con una hora adicional de programación en Python. No es necesario saber de programación en estos lenguajes aunque es muy deseable haber estado expuesto a un nivel introductorio cualquier software estadístico (Stata, SPSS, EViews,etc) o lenguaje de programación (Matlab, Mathematica, etc). Los estudiantes tendrán que formar grupos (de mínimo dos personas a máximo cuatro personas) para hacer las siguientes entregas: Taller 1 (30% de la nota) Taller 2 (30% de la nota) Prepropuesta de proyecto final (10% de la nota) Proyecto final (30% de la nota)
Ver más