Conférencier invité

  • Rémi Munos (INRIA, Lille)

Titre: Algorithmes "optimistes" pour l'optimisation de fonctions

Le principe de "l'optimisme dans l'incertain" a été récemment appliqué à des problèmes difficile de prise de décisions, tels que le jeu de go. L'idée est d'utiliser des algorithmes de bandit qui génèrent un bon compromis entre l'exploration (acquisition d'informations concernant le problème à résoudre) et l'exploitation (optimisation selon les connaissances actuelles) afin d'explorer de manière efficace l'espace des solutions possibles en s'adaptant automatiquement à la régularité du problème. Dans cette présentation, je décrirai l'algorithme SOO (Simultaneous Optimistic Optimization) qui vise à optimiser une fonction lorsque la régularité de cette fonction au voisinage de son maximum n'est pas connue à l'avance.