Síguenos en Facebook
Programa agentes que aprendan de sus experiencias
Descarga:
Información Completa del Curso
| DRLv2 2025 - Información Completa.pdf | |
| File Size: | 603 kb |
| File Type: | |
|
Beneficios
36 horas, 4 horas la semana (Horario de la Ciudad de México)
|
Objetivo del cursoAprender a programar y entrenar agentes dinámicos que resuelvan tareas secuenciales a través de la experiencia adquirida por la interacción agente-ambiente, optimizando la recompensa.
Casos de Estudio
Herramientas a aprender a usar:
Pytorch, Gymnasium, Numpy, Matplotlib. |
Contenido resumido del curso
|