Date/heure
24 mai 2018
09:15 - 10:15
Oratrice ou orateur
Bruno Scherrer
Catégorie d'évènement Groupe de travail Probabilités et Statistique
Résumé
Dans une première partie, on considèrera et illustrera les problèmes de contrôle optimal à horizon fini. Apres la dérivation des équations de Bellman, on verra comment calculer efficacement, par « programmation dynamique », la valeur d’une politique et une politique optimale.
Dans une seconde partie, on considèrera les problèmes actualisés stationnaires à horizon infini. Je détaillerai la preuve d’un résultat fondamental de ce cadre: l’existence d’une politique optimale stationnaire. On présentera ensuite un algorithme, itération sur les politiques, pour résoudre ce problème de manière élégante et efficace (si le temps le permets, j’évoquerai de récents résultats sur sa complexité).