¿Qué quieres aprender?

Aprendizaje por Refuerzo Profundo 2.0

Aprendizaje por Refuerzo Profundo 2.0

Frogames Formación

Curso online


60

En este curso, aprenderemos e implementaremos un nuevo modelo de IA increíblemente inteligente, llamado el Gradiente de Política Determinista de doble retardo (Twin Delayed DDPG, en inglés), que combina las técnicas más avanzadas en Inteligencia Artificial, incluyendo el Aprendizaje de Doble Profundidad, Políticas de Gradiente y Actor-Crítico. El modelo es tan robusto que, por primera vez en nuestros cursos, somos capaces de resolver las aplicaciones de IA virtual más desafiantes (entrenar a una hormiga/araña y medio humanoide a caminar y correr a través de un terreno).

Parte 1: Fundamentos En esta parte estudiaremos todos los fundamentos de la Inteligencia Artificial que te permitirán entender y dominar la IA de este curso. Estos incluyen Q-Learning, Deep Q-Learning, Políticas de Gradiente, Actor-Crítico y mucho más.

Parte 2: La teoría del DDPG de doble retardo Estudiaremos a fondo toda la teoría que hay detrás del modelo. Verás claramente todo el proceso de construcción y entrenamiento de la IA a través de una serie de diapositivas de visualización. No sólo aprenderás la teoría en detalle, sino que también darás forma a toda la intuición para saber cómo aprende y trabaja la IA. Los fundamentos de la Parte 1, combinados con la muy detallada teoría de la Parte 2, harán que este modelo altamente avanzado sea accesible para ti y, con el tiempo, serás una de las pocas personas que puede dominar y entender este modelo.

Parte 3: La implementación del DDPG de doble retardo: Implementaremos el modelo desde cero, paso a paso y a través de sesiones interactivas. Una nueva característica de este curso que te hará practicar en muchos ejercicios de codificación mientras implementamos el modelo. Al hacerlos, no seguirás el curso de forma pasiva, sino muy activa, permitiéndote así mejorar eficazmente tus habilidades en programación e IA.

¿Quieres hablar con un asesor sobre este curso?

Objetivos

Los objetivos del cursos consisten en integrar toda la teoría y aplicación práctica de los algoritmos de Deep Reinforcement Learning: - Q-Learning - Deep Q-Learning - Políticas de gradiente - Modelos de Actor-Crítico - Gradiente de Política Determinista Profunda (DDPG) - GPDP de doble retardo (TD3) o Twin Delayed DDPG - Conocer las técnicas fundamentales del aprendizaje por refuerzo profundo - Implementar un modelo del estado del arte más actual de IA

Requisitos

Este es un curso de nivel avanzado, por tanto es altamente recomendable: - Haber completado los cursos de la ruta de matemáticas para tener las bases de álgebra, probabilidad, estadística y cálculo - Haber completado los cursos de Machine Learning de la A a la Z y Deep Learning de la A a la Z para tener las bases de programación en Python e IA necesarias de cara a sacarle más provecho al curso - Tener un ordenador con conexión a internet y con cualquier sistema operativo instalado y saber utilizarlo a nivel básico de usuario

Temario completo de este curso

Contenido del Curso

  • Bienvenidos a Aprendizaje por Refuerzo Profundo 2.0(47:03)
  • Parte 1 - Fundamentos(1:18:26)
  • Parte 2 - Teoría del GPDP (TD3) de Doble Retardo(1:09:27)
  • Parte 3 - Implementación del GPDP (TD3) de Doble Retardo(5:02:35)
  • La Demo Final(47:14)
  • Anexo 1 - Redes Neuronales Artificiales(1:48:11)
  • Anexo 2 - Q-Learning(1:34:04)
  • Anexo 3 - Q-Learning Profundo(30:18)
  • Los Bonus por adquirir el curso en Frogames(1:26:08)
Ver más