Agenda (provisoire)

Le mercredi après-midi (conférence invitée et session) sont communs avec CAp.

Note: Les liens vers les papiers seront rétablis dès que les actes en ligne seront prêts.

HoraireTitreAuteurs
 
Mardi 22
10h-11hSession 1
10h-10h30Regroupement non-supervisé d'utilisateurs par leur comportement pour les systèmes de dialogue parléSenthilkumar Chandramohan, Matthieu Geist, Fabrice Lefèvre et Olivier Pietquin
10h30-11hProblèmes de Plus Sûr et Plus Court Chemin StochastiqueFlorent Teichteil-Königsbuch
11h-11h30Pause
11h30-13hSession 2
11h30-12hSpatial Knowledge in Planning LanguageLamia Belouaer, Maroua Bouzid et Abdel-Illah Mouaddib
12h-12h30Vers une gestion des croyances pour la planification Homme - RobotJulien Guitton, Matthieu Warnier et Rachid Alami
12h30-13hMGP: Un algorithme de planification temps réel prenant en compte l'évolution dynamique du butDamien Pellier, Mickaël Vanneufville, Humbert Fiorino, Marc Metivier et Bruno Bouzy
13h-14hRepas
14h-15h30Session 3
14h-14h30BRL Quasi-Optimal à l’aide de Transitions Locales OptimistesMauricio Araya-López, Vincent Thomas et Olivier Buffet
14h30-15hApproximations de l'algorithme Itérations sur les Politiques ModifiéBruno Scherrer, Victor Gabillon, Mohammad Ghavamzadeh et Matthieu Geist
15h-15h30Un sélecteur de Dantzig pour l'apprentissage par différences temporellesMatthieu Geist, Bruno Scherrer, Alessandro Lazaric et Mohammad Ghavamzadeh
15h30-16hPause
16h-17hSession 4
16h-16h30Détection et reconnaissance de cibles en ligne pour des UAV autonomes avec un modèle de type POMDPCaroline Ponzoni Carvalho Chanel, Florent Teichteil-Königsbuch et Charles Lesire
16h30-17hLes POMDP font de meilleurs hackers: Tenir compte de l’incertitude dans les tests de pénétrationCarlos Sarraute, Olivier Buffet et Joerg Hoffmann
17h-17h30AG
 
20hDîner de gala
 
Mercredi 23
9h30-11hSession 5
9h30-10hAlgorithmes hybrides pour la gestion intelligente de l'énergie dans les smart gridsRobin Roche, Lhassane Idoumghar, Bejamin Blunier et Abdellatif Miraoui
10h-10h30Contrôle du niveau de collaboration Humain-Robot sous un environnement complexe, via un modèle de l'autonomie ajustableNicolas Côté, Arnaud Canu, Maroua Bouzid et Abdel-Illah Mouaddib
10h30-11hFonctions de Valeurs Distribuées sous Contraintes de Communication pour la Coordination Décentralisée d'Agents DécisionnelsLaëtitia Matignon, Laurent Jeanpierre et Abdel-Illah Mouaddib
11h-11h30Pause
11h30-13hSession 6
11h30-12hAdaptation de la matrice de covariance pour l'apprentissage par renforcement directFreek Stulp et Olivier Sigaud
12h-12h30Apprentissage par Renforcement sans Modèle et avec Action ContinueThomas Degris, Patrick Pilarski et Richard Sutton
12h30-13h``Réservoir computing'' et Apprentissage par Renforcement DéveloppementalAlain Dutech
13h-14hRepas
14h-15hConférence invitée
 Algorithmes "optimistes" pour l'optimisation de fonctionsRémi Munos
15h-15h30Pause
15h30-17h30Session 7 (CAp/JFPDA)
15h30-16hApprentissage par renforcement rapide pour des grands ensembles d'actions en utilisant des codes correcteurs d'erreurGabriel Dulac-Arnold, Ludovic Denoyer, Philippe Preux et Patrick Gallinari
16h-16h30Optimisation de contrôleurs par essaim particulaireJérémy Fix et Matthieu Geist
16h30-17hGénéralisation Min Max pour l'Apprentissage par Renforcement Batch et Déterministe : Schémas de RelaxationRaphael Fonteneau, Damien Ernst, Bernard Boigelot et Quentin Louveaux
17h-17h30Classification structurée pour l'apprentissage par renforcement inverseEdouard Klein, Bilal Piot, Matthieu Geist et Olivier Pietquin