Curso online
Duración : 10 Semanas
El concepto de oncología genómica o de precisión no es completamente nuevo, los médicos han estado utilizando el tipo de sangre para adaptar las transfusiones durante más de un siglo. Lo que hoy es diferente es el rápido crecimiento de los datos genómicos que se pueden recopilar de forma rápida y barata del paciente, y de la comunidad en general, y el potencial para obtener información a partir del intercambio de esos datos. Gracias a este Curso, los profesionales se adentrarán en el estudio de las técnicas de minería y extracción de datos en oncología genómica.
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Objetivos
Objetivo general Ser capaz de interpretar con precisión el volumen de información clínica disponible actualmente y asociado a los datos biológicos que se generan tras un análisis bioinformático. Objetivos específicos Comprender cómo la mayoría de los datos científicos aparecen en documentos como páginas web y archivos PDF, difícilmente procesables, para su posterior análisis. Sin embargo, mediante las técnicas de scraping podemos hacerlos utilizables. Acceder a diferentes fuentes de datos. La posibilidad de acceder a muchas fuentes de datos a través de la web ha convertido a las técnicas de scraping en una parte esencial del conjunto de herramientas para la implantación de la medicina de precisión, al permitir la extracción masiva de información, su posterior procesamiento y conversión en datos útiles para su interpretación.
A quién va dirigido
El Curso Universitario en Técnicas de Minería y Extracción de Datos en Oncología Genómica está orientado a facilitar la actuación del médico dedicado al tratamiento de la patología oncológica, en la que es preciso interpretar con precisión el volumen ingente de información clínica disponible actualmente y asociarlo a los datos biológicos que se generan tras un análisis bioinformático.
Temario completo de este curso
Módulo 1. Técnicas de extracción de datos genómicos
1.1. Introducción al “scraping data”
1.1.1. Definición
1.1.2. Principios básicos
1.2. Importación de archivos de datos de hoja de cálculo almacenados online
1.2.1. Introducción
1.3. Scraping de texto HTML
1.3.1. Introducción
1.3.2. Principios básicos
1.4. Scraping los datos de una tabla HTML
1.4.1. Introducción
1.4.2. Principios básicos
1.5. Aprovechar las API para scraping de los datos
1.5.1. Introducción
1.6. Extraer la información relevante
1.6.1. ¿Cómo extraer la información de los datos?
1.7. Uso del paquete Rvest de R
1.7.1. Introducción
1.7.2. Principios básicos
1.8. Obtención de datos distribuidos en múltiples páginas
1.8.1. ¿Cómo obtener los datos?
1.9. Extracción de datos genómicos de la plataforma “My Cancer Genome”
1.9.1. ¿Cómo extraer los datos?
1.10. Extracción de información sobre genes de la base de datos HGNC (Hugo Gene Nomenclature Committee)
1.10.1. Introducción
1.10.2. Proceso de extracción de información
1.11. Extracción de datos farmacológicos de la base de datos “ONCOKG” (Precision Oncology Knowledge Base)
1.11.1. Introducción
1.11.2. Proceso de extracción de datos
Módulo 2. Nuevas técnicas en la era genómica
2.1. Entendiendo la nueva tecnología: Next Generation Sequence (NGS) en la práctica clínica
2.2.1. Introducción
2.2.2. Antecedentes
2.2.3. Problemas en la aplicación de la Secuenciación Sanger en Oncología
2.2.4. Nuevas técnicas de Secuenciación
2.2.5. Ventajas del uso de la NGS en la práctica clínica
2.2.6. Limitaciones del uso de la NGS en la práctica clínica
2.2.7. Términos y definiciones de interés
2.2.8. Tipos de estudios en función de su tamaño y profundidad
2.2.8.1. Genomas
2.2.8.2. Exomas
2.2.8.3. Paneles multigénicos
2.2.9. Etapas en la secuenciación NGS
2.2.9.1. Preparación de muestras y librerías
2.2.9.2. Preparación de templates y Secuenciación
2.2.9.3. Procesado bioinformático
2.2.10. Anotación y clasificación de variantes
2.2.10.1. Bases de datos poblacionales
2.2.10.2. Bases de datos locus específicas
2.2.10.3. Predictores bioinformáticos de funcionalidad
2.2. Secuenciación DNA y análisis bioinformático
2.2.1. Introducción
2.2.2. Software
2.2.3. Procedimiento
2.2.3.1. Extracción de secuencias crudas
2.2.3.2. Alineación de secuencias
2.2.3.3. Refinamiento de la alineación
2.2.3.4. Llamada de variantes
2.2.3.5. Filtrado de variantes
2.3. Secuenciación RNA y análisis bioinformático
2.3.1. Introducción
2.3.2. Software
2.3.3. Procedimiento
2.3.3.1. Evaluación de QC de datos sin procesar
2.3.3.2. Filtrado de RNAr
2.3.3.3. Datos filtrados de control de calidad
2.3.3.4. Recorte de calidad y eliminación del adaptador
2.3.3.5. Alineación de reads a una referencia
2.3.3.6. Llamada de variantes
2.3.3.7. Análisis de expresión diferencial del gen
2.4. Tecnología ChIP-Seq
2.4.1. Introducción
2.4.2. Software
2.4.3. Procedimiento
2.4.3.1. Descripción del conjunto de datos CHiP-Seq
2.4.3.2. Obtener información sobre el experimento utilizando los sitios web de GEO y SRA
2.4.3.3. Control de calidad de los datos de secuenciación
2.4.3.4. Recorte y filtrado de reads
2.4.3.5. Visualización los resultados con Integrated Genome Browser (IGV)
2.5. Big data aplicado a la oncología genómica
2.5.1. El proceso de análisis de datos
2.6. Servidores genómicos y bases de datos de variantes genéticas
2.6.1. Introducción
2.6.2. Servidores genómicos en web
2.6.3. Arquitectura de los servidores genómicos
2.6.4. Recuperación y análisis de datos
2.6.5. Personalización
2.7. Anotación de variantes genéticas
2.7.1. Introducción
2.7.2. ¿Qué es la llamada de variantes?
2.7.3. Entendiendo el formato VCF
2.7.4. Identificadores de variantes
2.7.5. Análisis de variantes
2.7.6. Predicción del efecto de la variación en la estructura y función de la proteína