10e Journée Statistique et Informatique pour la Science des Données à Paris-Saclay

Collection 10e Journée Statistique et Informatique pour la Science des Données à Paris-Saclay

Organisateur(s) Evgenii Chzhen, Erwan Le Pennec
Date(s) 01/04/2025 - 01/04/2025
URL associée https://indico.math.cnrs.fr/event/14016/
00:00:00 / 00:00:00
6 6

Training Overparametrized Neural Networks: Early Alignment Phenomenon and Simplicity Bias

De Etienne Boursier

The training of neural networks with first order methods still remains misunderstood in theory, despite compelling empirical evidence. Not only it is believed that neural networks converge towards global minimizers, but the implicit bias of optimisation algorithms makes them converge towards specific minimisers with nice generalisation properties. This talk focuses on the early alignment phase that appears in the training dynamics of two layer networks with small initialisations. During this early alignment phase, the numerous neurons align towards a few number of key directions, hence leading to some sparsity in the number of represented neurons. While this alignment phenomenon can be at the origin of convergence towards spurious local minima of the network parameters, such local minima can actually have good properties and yield much lower excess risks than any global minimizer of the training loss. In other words, this early alignment can lead to a simplicity bias that is helpful in minimizing the test loss.

Informations sur la vidéo

  • Date de captation 01/04/2025
  • Date de publication 10/04/2025
  • Institut IHES
  • Langue Anglais
  • Audience Chercheurs
  • Format MP4

Domaine(s)

Dernières questions liées sur MathOverflow

Pour poser une question, votre compte Carmin.tv doit être connecté à mathoverflow

Poser une question sur MathOverflow




Inscrivez-vous

  • Mettez des vidéos en favori
  • Ajoutez des vidéos à regarder plus tard &
    conservez votre historique de consultation
  • Commentez avec la communauté
    scientifique
  • Recevez des notifications de mise à jour
    de vos sujets favoris
Donner son avis