Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes (JFPDA)

 

Programme

Notes:

  • Une demi-heure est réservée pour chaque article (exposé + questions).
  • Les demi-heures restantes seront exploitées pour des discussions diverses (associées aux articles, aux tutoriels, au futur des JFPDA, ou à d'autres sujets).
Lundi 02/07 Mardi 03/07
08:30
09:30
Invité : Aldo Gangemi Invité : Zhongzhi Shi
09:30
09:45
pause-café pause-café
09:45
11:15
Session 1 : planification
  • Olivier Buffet, Jilles Dibangoye, Abdallah Saffidine et Vincent Thomas
    Recherche heuristique pour jeux stochastiques (à somme nulle)
  • Erwan Lecarpentier, Guillaume Infantes, Charles Lesire and Emmanuel Rachelson
    Open Loop Execution of Tree-Search Algorithms
  • Rémi Lacaze-Labadie, Domitile Lourdeaux et Mohamed Sallak
    Génération de scénario : planification avec un opérateur défini par un modèle graphique
Session 4 commune démo/posters
11:45
13:00
pause repas pause repas
13:00
15:00
Session 2 - tutoriel (par Frédéric Maris)
La planification par compilation
  • Tutoriel (1h)
  • +article:
    Frédéric Maris, Maël Valais et Julien Vianey
    Codage SMT dans un espace de plans (liens causaux) pour la planification temporelle en temps continu
  • +discussions
Session 5 : Systèmes multi-agents
  • Jonathan Cohen et Abdel-Illah Mouaddib
    Re-formation décentralisée d'équipes sous incertitude : modèle et propriétés structurelles
  • Guillaume Bono, Jilles Dibangoye, Laetitia Matignon, Florian Pereyron et Olivier Simonin
    Sur le Gradient de la Politique pour les Systèmes Multi-Agents Coopératifs
  • Jilles Dibangoye et Olivier Buffet
    Apprendre à agir dans les Dec-POMDPs continus
15:00
15:30
pause-café pause-café
15:30
17:30
Session 3 - tutoriel (par Olivier Sigaud)
L'apprentissage par renforcement profond

  • Tutoriel (1h)
  • +discussions
Session 6 : Apprentissage par renforcement
  • Frédéric Koriche
    Compilation de Jeux de Prédictions Combinatoires
  • Cédric Colas, Olivier Sigaud et Pierre-Yves Oudeyer
    GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms
  • Alain Dutech, Jérémy Fix et Hervé Frezza-Buet
    Reconstruction d’état caché avec cartes auto-organisatrices récurrentes
Soirée Cocktail de bienvenue