Experto Universitario en Técnicas de Learning Machine y Minería de Datos ...

Experto Universitario en Técnicas de Learning Machine y Minería de Datos en Oncología Genómica

Universidad CEU Cardenal Herrera. Formación online

Postgrado online


1.750 

Duración : 6 Meses

¿Quieres hablar con un asesor sobre este curso?

Objetivos

Objetivo general Ser capaz de interpretar con precisión el volumen de información clínica disponible actualmente y asociado a los datos biológicos que se generan tras un análisis bioinformático. Objetivos específicos El aprendizaje automático está revolucionando el mundo de la genómica, y ¿por qué no el de la medicina? El aprendizaje automático permite procesar y analizar de forma rápida y automática enormes volúmenes de datos complejos estructurados, semiestructurados y no estructurados (Big Data), y es fundamental para innumerables aplicaciones nuevas y futuras para obtener información y conocimiento. El aprendizaje automático potencia tecnologías innovadoras tales como motores de recomendación, reconocimiento de patrones, protección contra efectos adversos e incluso la interacción entre profesionales y pacientes.

A quién va dirigido

El Experto Universitario en Técnicas de Learning Machine y Minería de Datos en Oncología Genómica está orientado a facilitar la actuación del médico dedicado al tratamiento de la patología oncológica en la que es preciso interpretar con precisión el volumen ingente de información clínica disponible actualmente y asociarlo a los datos biológicos que se generan tras un análisis bioinformático.

Requisitos

Solo para médicos especialistas.

Temario completo de este curso

Módulo 1. Machine learning para el análisis de big data

1.1. Introducción.

1.1.1. Aprendizaje automático frente a modelado estadístico.
1.1.2. Aprendizaje supervisado vs no supervisado.

1.2. Configuración inicial: cargar paquetes y el conjunto de datos.
1.3. Preparación de datos y preprocesamiento.

1.3.1. ¿Cómo dividir el conjunto de datos de entrenamiento y validación?
1.3.2. Estadísticas descriptivas.
1.3.3. ¿Cómo imputar valores perdidos usando ‘preProcess’?
1.3.4. ¿Cómo crear variables ficticias?
1.3.5. ¿Cómo preprocesar para transformar los datos?

1.4. Cómo visualizar la importancia de las variables usando `featurePlot`
1.5. ¿Cómo hacer la selección de características utilizando la eliminación recursiva de características (`rfe`)?
1.6. Entrenando y ajustando el modelo.

1.6.1. ¿Cómo `entrenar` el modelo e interpretar los resultados?
1.6.2. ¿Cómo calcular la importancia de la variable?
1.6.3. Preparar el conjunto de datos de entrenamiento.
1.6.4. Predecir en los datos de entrenamiento.
1.6.5. Matriz de confusión.

1.7. ¿Cómo hacer el ajuste del hiperparámetro para optimizar el modelo para un mejor rendimiento?

1.7.1. Configurando el `trainControl`.
1.7.2. Afinación del hiperparámetro usando `tuneLength`.
1.7.3. Ajuste del hiperparámetro usando `tuneGrid`.

1.8. ¿Cómo evaluar el rendimiento de múltiples algoritmos de aprendizaje automático?

1.8.1. Entrenamiento Adaboost.
1.8.2. Entrenamiento de Random Forest.
1.8.3. Entrenamiento xgBoost Dart.
1.8.4. Entrenamiento Support Vector Machine (SVM).
1.8.5. Entrenamiento Redes neuronales.
1.8.6. Ejecutar remuestras para comparar los modelos.

1.9. Conjuntando las predicciones.

1.9.1. ¿Cómo agregar predicciones a partir de múltiples modelos usando caretEnsemble?
1.9.2. ¿Cómo combinar las predicciones de múltiples modelos para formar una predicción final?

Módulo 2. Minería datos aplicado a la genómica

2.1. Introducción.
2.2. Inicialización de variables.
2.3. Limpieza y acondicionado del texto.
2.4. Generación de la Matriz de Términos.

2.4.1. Creación de la Matriz de Términos TDM.
2.4.2. Visualizaciones sobre la matriz de palabras TDM.

2.5. Descripción de la matriz de términos.

2.5.1. Representación gráfica de las frecuencias.
2.5.2. Construcción de una nube de palabras.

2.6. Creación de un data.frame apto para K-NN.
2.7. Construcción del Modelo de clasificación.
2.8. Validación del Modelo de clasificación.
2.9. Ejercicio práctico guiado de minería de datos en genómica en cáncer.

Módulo 3. Técnicas de extracción de datos genómicos

3.1. Introducción al ‘scraping data’.
3.2. Importación de archivos de datos de hoja de cálculo almacenados on line.
3.3. Scraping de texto HTML.
3.4. Scraping los datos de una tabla HTML.
3.5. Aprovechar las API para scraping de los datos.
3.6. Extraer la información relevante.
3.7. Uso del paquete Rvest de R.
3.8. Obtención de datos distribuidos en múltiples páginas.
3.9. Extracción de datos genómicos de la plataforma ‘My Cancer Genome’.
3.10. Extracción de información sobre genes de la base de datos ‘HGNC Hugo Gene Nomenclature Committee’.
3.11. Extracción de datos farmacológicos de la base de datos ‘ONCOKG’ (Precision Oncology Knowledge Base).

Ver más