Les mathématiques derrière ChatGPT

By Borjan Geshkovski

Appears in collection : Séminaire Mathematic Park

Derrière les chatbots comme ChatGPT ou le Chat se cachent de grands réseaux de neurones entraînés sur des quantités massives de données, appelés Transformers. Il se trouve que ces réseaux peuvent être interprétés comme des systèmes de particules en interaction, où les mots jouent le rôle de particules et les couches du réseau celui du temps. Cette interprétation met en évidence des liens féconds entre ces réseaux et des modèles de gaz comme le modèle de Coulomb, des systèmes d’oscillateurs comme celui de Kuramoto, ainsi que de nombreuses questions de combinatoire (empilement compact), contribuant ainsi à mieux comprendre pourquoi ces modèles fonctionnent.

Information about the video

Domain(s)

Last related questions on MathOverflow

You have to connect your Carmin.tv account with mathoverflow to add question

Ask a question on MathOverflow




Register

  • Bookmark videos
  • Add videos to see later &
    keep your browsing history
  • Comment with the scientific
    community
  • Get notification updates
    for your favorite subjects
Give feedback