Une histoire de mots inattendus et de génomes
Apparaît également dans la collection : ALEA Days 2017 / Journées ALEA 2017
Dans une première partie, je présenterai différentes problématiques liées à des statistiques d'occurrences de mots dans des génomes et décortiquerai plus en détail la question de savoir comment détecter si un mot a une fréquence d'apparition significativement anormale dans une séquence. Dans une deuxième partie, je présenterai différentes extensions pour tenir compte du fait qu'un motif d'ADN fonctionnel n'est pas toujours un « mot », mais qu'il peut avoir une structure plus complexe qui nécessite le développement de nouvelles méthodes statistiques.