Mathematics for and by Large Language Models

Collection Mathematics for and by Large Language Models

Organisateur(s) François Charton, Michael Douglas, Yiannis Vlassopoulos
Date(s) 23/05/2024 - 23/05/2024
URL associée https://indico.math.cnrs.fr/event/11933/
00:00:00 / 00:00:00
6 7

Three Problems in the Mathematics of Deep Learning

De Andrew Dudzik

Neural networks, particularly LLMs, are notoriously poor at algorithmic tasks, such as sorting, shortest path, and even basic arithmetic. Across three papers, we explored the problem of "aligning" architectures to classical computer programs, and showed that this question relates to familiar mathematical concepts: polynomial functors, cohomology, and higher categories.

Informations sur la vidéo

  • Date de captation 23/05/2024
  • Date de publication 25/05/2024
  • Institut IHES
  • Licence CC BY-NC-ND
  • Langue Anglais
  • Audience Chercheurs
  • Format MP4

Dernières questions liées sur MathOverflow

Pour poser une question, votre compte Carmin.tv doit être connecté à mathoverflow

Poser une question sur MathOverflow




Inscrivez-vous

  • Mettez des vidéos en favori
  • Ajoutez des vidéos à regarder plus tard &
    conservez votre historique de consultation
  • Commentez avec la communauté
    scientifique
  • Recevez des notifications de mise à jour
    de vos sujets favoris
Donner son avis