Analyse probabiliste d’un algorithme d’apprentissage par renforcement pour trouver des plus courts chemins.

Date/heure
16 juin 2022
09:15 - 10:15

Oratrice ou orateur
Zoé Varin

Catégorie d'évènement
Groupe de travail Probabilités et Statistique


Résumé

On considère un algorithme probabiliste suivi par des fourmis cherchant un plus court chemin entre leurs nids et une source de nourriture. À chaque étape une fourmi suit une marche aléatoire, dont les transitions dépendent des phéromones déposés par les fourmis précédentes, de son nid jusqu’à la source de nourriture. Nous verrons que le renforcement (i.e. le choix des arêtes sur lesquelles une fourmi dépose des phéromones) influe sur le comportement du processus, qui dans un certain nombre de cas converge : intuitivement, les fourmis coopèrent pour trouver des plus courts chemins. Je parlerai de différents résultats de convergence, en particulier pour une variante du modèle sur laquelle j’ai travaillé, dans laquelle le nid de départ est également aléatoire.