Séminaire Mathematic Park

Collection Séminaire Mathematic Park

00:00:00 / 00:00:00
40 54

Une chaîne de Markov est un système dynamique aléatoire; l'état au temps t+1 dépend de l'état au temps t et d'un tirage au sort. Les chaînes de Markov modélisent un grand nombre de problèmes, météorologie, processus industriel, ou même des modèles démographiques. Ajouter le concept de décision conduit à un processus décisionnel de Markov : l'état au temps t+1 dépend (1) de l'état au temps t, (2) d'un tirage au sort et (3) de la décision prise. On parle alors de processus décisionnel de Markov. On peut aussi ajouter la notion de récompense ; par exemple, pour un système économique, il peut s'agir d'argent engrangé. Pour un système industriel, il peut s'agir de pollution (récompense ici négative). Il peut éventuellement y avoir plusieurs plusieurs acteurs prenant des décisions (ayant des objectifs différents éventuellement, voire totalement antagonistes, comme souvent dans les jeux). Il peut aussi y avoir une difficulté d'observation : on doit alors prendre une décision en ne connaissant qu'une partie de l'état. On discutera les modèles (beaucoup), la théorie (les grandes lignes) et le champ d'application (brièvement).

Informations sur la vidéo

  • Date de publication 26/05/2014
  • Institut IHP
  • Audience Etudiants
  • Format MP4

Dernières questions liées sur MathOverflow

Pour poser une question, votre compte Carmin.tv doit être connecté à mathoverflow

Poser une question sur MathOverflow




Inscrivez-vous

  • Mettez des vidéos en favori
  • Ajoutez des vidéos à regarder plus tard &
    conservez votre historique de consultation
  • Commentez avec la communauté
    scientifique
  • Recevez des notifications de mise à jour
    de vos sujets favoris
Donner son avis