Cronograma de presentaciones, curso tutorial de Reinforcement Learning (2022-1):

Participantes: 

0. Mauricio Velasco
1. Nicolás Betancourt 
2. Nicolás Castro 
3. Sergio Cristancho 
4. David Corredor
5. Juan Camilo Bedoya
6. Juan Manuel Perez
7. Federico Galvez
8. Nicolás Rugeles 
9. Santiago Fino 
10. Mateo Campo 
11. Jose Luis Mora
12. Deniz Sanchez
13. Javier Hernán García 
14. Melissa Robles

Las secciones se refieren al libro de Dimitris Bertsekas [BRL] "Reinforcement learning and optimal control" (2019)

El número entre paréntesis [j] indica el presentador de cada semana según la lista de arriba.


Semana 1: [0] Deterministic dynamic programming (1.1)
Semana 2: [1] Stochastic dynamic programming / multi-armed bandits (1.2)
Semana 3: [2] Examples of dynamic programming (1.3)

Semana 4: ENTREGA 1 de los proyectos

Semana 5: [3]  Approximation in Value Space (2.1, 2.2, 2.3)
Semana 6: [4]  Look-ahead, Rollout y MonteCarlo tree search (2.2 -2.3)
Semana 7: [5]  Arquitecturas de aproximación (3.1,3.2)

Semana 8: ENTREGA 2 de los proyectos

Semana 9: [6]  Sequential and Q-factor approximations (3.3-3.4)
Semana 10: [7] Infinite horizon problems (4.1,4.2,4.3)
Seamana 11: [8] Exact and approximate value iteration (4.4)
Semana 12: [9] Policy iteration (4.5)
Semana 13: [10] Performance bounds (4.6) 
Semana 14: [11] Simulation based policy iteration (4.7)
Semana 15: [12] Q-learning (4.8)

Semana 16: [13] Aggregation (5)
Semana 16: ENTREGA 3 de los proyectos


OVERLEAF NOTAS:
	Overleaf view link (para cuando quieran leer las notas escritas por otros participantes)
	https://www.overleaf.com/read/ptxqqvkvprwq

	Overleaf edit link (para cuando escriban las de su semana)
	https://www.overleaf.com/6233529936wkbdyyrbnhyn