00:00:00 / 00:00:00

Apparaît dans la collection : Theoretical Computer Science Spring School: Machine Learning / Ecole de Printemps d'Informatique Théorique : Apprentissage Automatique

In this tutorial I will discuss recent advances in theory of multi-armed bandits and reinforcement learning, in particular the upper confidence bound (UCB) and Thompson Sampling (TS) techniques for algorithm design and analysis.

Informations sur la vidéo

Données de citation

  • DOI 10.24350/CIRM.V.19921203
  • Citer cette vidéo Agrawal, Shipra (23/05/2022). Multi-armed bandits and beyond. CIRM. Audiovisual resource. DOI: 10.24350/CIRM.V.19921203
  • URL https://dx.doi.org/10.24350/CIRM.V.19921203

Dernières questions liées sur MathOverflow

Pour poser une question, votre compte Carmin.tv doit être connecté à mathoverflow

Poser une question sur MathOverflow




Inscrivez-vous

  • Mettez des vidéos en favori
  • Ajoutez des vidéos à regarder plus tard &
    conservez votre historique de consultation
  • Commentez avec la communauté
    scientifique
  • Recevez des notifications de mise à jour
    de vos sujets favoris
Donner son avis