Les mathématiques derrière ChatGPT

De Borjan Geshkovski

Apparaît dans la collection : Séminaire Mathematic Park

Derrière les chatbots comme ChatGPT ou le Chat se cachent de grands réseaux de neurones entraînés sur des quantités massives de données, appelés Transformers. Il se trouve que ces réseaux peuvent être interprétés comme des systèmes de particules en interaction, où les mots jouent le rôle de particules et les couches du réseau celui du temps. Cette interprétation met en évidence des liens féconds entre ces réseaux et des modèles de gaz comme le modèle de Coulomb, des systèmes d’oscillateurs comme celui de Kuramoto, ainsi que de nombreuses questions de combinatoire (empilement compact), contribuant ainsi à mieux comprendre pourquoi ces modèles fonctionnent.

Informations sur la vidéo

Domaine(s)

Dernières questions liées sur MathOverflow

Pour poser une question, votre compte Carmin.tv doit être connecté à mathoverflow

Poser une question sur MathOverflow




Inscrivez-vous

  • Mettez des vidéos en favori
  • Ajoutez des vidéos à regarder plus tard &
    conservez votre historique de consultation
  • Commentez avec la communauté
    scientifique
  • Recevez des notifications de mise à jour
    de vos sujets favoris
Donner son avis