[bull-ia] < thèse / PhD position > information-oriented planning

[English version below]

– – – – – – – – – – – –

Bonjour,

Nous invitons les candidatures à une thèse de doctorat au LORIA/INRIA à
Nancy.

*Titre*: Planification orientée-information avec les rho-POMDP

L’objectif de cette thèse est de proposer de nouveaux algorithmes pour
résoudre des problèmes de planification orientée-information,
c’est-à-dire pour décider quelle séquence d’actions accomplir afin de
collecter des informations concernant certaines variables cachées. On
peut donner comme exemples : un robot voulant se localiser lui-même ; un
système de surveillance de musée voulant suivre les visiteurs ; ou un
système médical voulant surveiller l’état d’un patient.
De tels problèmes sont formalisés comme des rho-POMDP, une extension des
POMDP avec des récompenses dépendant de la croyance. De premiers
algorithmes ont déjà été proposés, mais ceux-ci reposent sur des
propriétés spécifiques de la fonction de récompense. Cette thèse
étudiera les approches par recherche arborescente Monte Carlo (MCTS)
pour se passer de ces hypothèses et ne requérir qu’un modèle génératif
(un simulateur).

*Mots-Clefs*: intelligence artificielle, processus de décision
markoviens partiellement observables (POMDP), contrôle
orienté-information, recherche arborescente Monte Carlo (MCTS)

*Supervision*: Olivier Buffet et Vincent Thomas

*Date limite*: 1er mai

*Plus de détails + Comment candidater*:
https://jobs.inria.fr/public/classic/fr/offres/2019-01556

cordialement,
Olivier Buffet et Vincent Thomas

– – – – – – – – – – – –

Dear all,

We are inviting applications for a PhD position at LORIA/INRIA in Nancy,
France.

*Title*: Information-Oriented Planning with rho-POMDPs

The objective of the PhD thesis is to propose new algorithms for solving
information-oriented planning problems, i.e., deciding which sequence of
actions to perform in order to gather information regarding certain
hidden variables. Examples include: a robot willing to localize itself;
a museum surveillance system willing to track visitors; or a medical
system willing to monitor the state of a patient.
Such problems are formalized as rho-POMDPs, an extension of POMDPs with
belief-dependent rewards. First algorithms have already been proposed,
but they rely on specific properties of the reward function. This PhD
thesis will investigate Monte Carlo Tree Search (MCTS) approaches to do
without these assumptions and only requiring a generative model (a
simulator).

*Keywords*: Artificial Intelligence, Partially Observable Markov
Decision Processes (POMDPs), Information-Oriented Control, Monte Carlo
Tree Search (MCTS).

*Supervisors*: Olivier Buffet and Vincent Thomas

*Closing date*: May 1.

*More details + How to apply*:
https://jobs.inria.fr/public/classic/en/offres/2019-01556

Best regards,
Olivier Buffet and Vincent Thomas

– – – – – – – – – – – –

———————————————————————
Desinscription: envoyez un message a: bull-ia-unsubscribe@gdria.fr
Pour obtenir de l’aide, ecrivez a: bull-ia-help@gdria.fr