La demanda de profesionales expertos en ciencia de datos y la necesidad de profesionales capacitados en este lenguaje de programación está creciendo muy rápidamente y con ella los diferentes matices y habilidades técnicas requeridas para su desarrollo. El avance de las tecnologías permite recoger un número creciente de conjuntos de datos, cada vez mayores. Saber explorar, describir y analizar conjuntos de datos es una competencia cada día más valorada por los empleadores y más necesaria para comprender lo que nos rodea.
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Objetivos
Aprender a configurar el software necesario para un entorno de programación estadística, programar y usar R para un análisis de datos efectivo y aplicar conceptos genéricos del lenguaje de programación a medida que se implementan en un lenguaje estadístico de alto nivel.
A quién va dirigido
Profesionales líderes de procesos de compañías de seguros de áreas de tecnología, suscripción y operaciones interesados en gestionar la implementación de analítica de datos en los procesos de sus áreas.
Requisitos
Ninguno
Temario completo de este curso
MÓDULO I: INTRODUCCIÓN
Introducción
El software y su utilidad
Instalación del lenguaje de programación (R) y complementos (Rstudio)
Sintaxis del lenguaje
Estructura básica
Tipos de datos
Operadores y expresiones
Variables y asignación
Escribiendo en pantalla (print)
Listas, dataframes y hojas
Matrices
Paquetes librerías y repositorios
MÓDULO II. MANEJO DE DATOS Y PROGRAMACIÓN EN EL SOFTWARE
Importación y exportación de bases de datos
Tipos de fuentes de datos para importación (Archivos planos, encurtidos, entre otros)
Datos propios del software
Tipos de datos para exportar (txt, sas, xlsx, entre otros)
Distribuciones probabilísticas
Estudio de distribuciones de unos datos
Tablas estadísticas
Contraste entre muestras de datos
Herramientas de depuración y mantenimiento
Identificación y corrección de errores en los datos
Seleccionando datos y creando subconjuntos
Estructuras de control
Sentencias condicionales
Iteraciones o ciclos
Creación de scripts
Funciones
Concepto y uso
Elementos de una función
Definición de funciones
Modelos Estadísticos
Modelos lineales
Análisis de varianza y comparación de modelos (ANOVA)
Modelos Lineales Generalizados
Modelos de mínimos cuadrados no lineales y máxima verosimilitud
Visualización de datos
Gráficos base: histogramas, scatter plot, bar plot, box plot.
Personalización de gráficos: ejes, colores, títulos.
MÓDULO III. APLICACIONES EN EL SOFTWARE
Creación del código en scripts
Importación de una base de datos
Descripción de datos cualitativos y ordinales
Descripción de datos cuantitativos
Evaluación estadística de la información
Variables con otro tipo de formato
Valores faltantes
Gráficos estadísticos y probabilísticos de los datos