3rd Edition of Mathematics for and by Large Language Models

Collection 3rd Edition of Mathematics for and by Large Language Models

Organisateur(s) Michael Douglas, Amaury Hayat, Julio Parra-Martinez and Yiannis Vlassopoulos
Date(s) 28/05/2026 - 28/05/2026
URL associée https://indico.math.cnrs.fr/event/16396/
00:00:00 / 00:00:00
2 4

The Expressive Power of Large Language Models

De Gabriel Peyré

Large language models process vast sequences of input tokens by alternating between classical multi-layer perceptron layers and self-attention mechanisms. While the approximation capabilities of perceptrons are relatively well understood, those of attention mechanisms remain less explored. In this talk, I will compare the proof techniques and approximation results associated with these two types of layers, emphasizing key open questions that connect large language models with approximation theory in infinite-dimensional spaces representing input token distributions.

Informations sur la vidéo

  • Date de captation 28/05/2026
  • Date de publication 12/06/2026
  • Institut IHES
  • Langue Anglais
  • Audience Chercheurs
  • Format MP4

Dernières questions liées sur MathOverflow

Pour poser une question, votre compte Carmin.tv doit être connecté à mathoverflow

Poser une question sur MathOverflow




Inscrivez-vous

  • Mettez des vidéos en favori
  • Ajoutez des vidéos à regarder plus tard &
    conservez votre historique de consultation
  • Commentez avec la communauté
    scientifique
  • Recevez des notifications de mise à jour
    de vos sujets favoris
Donner son avis