Groupe de travail Probabilités et Statistique

Exposés à venir

Abonnement iCal

Archives

Introduction aux EDPS singulières et aux Structures de Régularité(III)

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 18 avril 2024 09:15-10:30 Lieu : Salle de conférences Nancy Oratrice ou orateur : Yvain Bruned Résumé :

Semi-LASSO: un weighted LASSO pour l'intégration de régresseurs connus dans un modèle linéaire

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 11 avril 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Anouk Rago (IECL) Résumé :

Le LASSO est une technique très largement utilisée lorsqu’il s’agit à la fois d’estimer les paramètres d’un modèle et d’effectuer une sélection de variables. Il est particulièrement utile pour étudier de grands jeux de données, comme cela peut être le cas en biologie des systèmes par exemple, ce qui le rend très utilisé dans le domaine de l’inférence de réseaux de gènes. Cette méthode peut par ailleurs être enrichie et améliorée par des connaissances préalables sur les régresseurs potentiels, afin de guider la sélection de variables. Dans ce cas, on peut employer un weighted LASSO, dérivé du LASSO original, dans lequel l’ajout de poids spécifiques à chaque variable permet d’encoder des a priori. Le package R `glmnet’ permet à l’utilisateur de spécifier ses propres poids via un paramètre. Nous introduisons ici une nouvelle méthode appelée semi-LASSO qui résout un cas spécifique de weighted LASSO. Son implémentation repose sur l’utilisation du package `glmnet’, mais inclut une première étape de réduction de dimension pour une meilleure optimisation de la fonction de coût du LASSO. Des simulations numériques sont effectuées sur des données synthétiques afin de comparer les résultats obtenus avec le weighted LASSO de `glmnet’ et notre méthode semi-LASSO.


Introduction aux EDPS singulières et aux Structures de Régularité(II)

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 4 avril 2024 09:15-10:30 Lieu : Salle Döblin Oratrice ou orateur : Yvain Bruned Résumé :

Introduction aux EDPS singulières et aux Structures de Régularité(I)

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 21 mars 2024 09:15-10:30 Lieu : Salle de conférences Nancy Oratrice ou orateur : Yvain Bruned Résumé :

Moyenne et Composantes Principales de séries temporelles, une nouvelle approche avec la méthode de la signature II

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 15 février 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Raphael Mignot (IECL) Résumé :

Suite du groupe de travail du 1er février. Le résumé est actualisé.

L’objectif de notre travail est double : établir un barycentre de séries temporelles multidimensionnelles et trouver des directions d’importance. Nous encodons les séries temporelles avec des intégrales de différents ordres de moments, constituant leur signature.

Dans un premier groupe de travail (1er fév.), nous avons introduit la topologie de l’espace des signatures et de leur espace ambiant, ainsi que leurs propriétés fondamentales. L’espace des coefficients de signature est une variété avec une structure de groupe mais sans métrique riemannienne bi-invariante, ce qui rend difficile l’utilisation d’approches Riemanniennes classiques.

Dans cet épisode 2, nous reviendrons sur les barycentres de signatures puis nous introduirons une généralisation de l’Analyse en Composantes Principales aux variétés différentiables. Dans le même esprit que la procédure de calcul de la moyenne, nous cherchons les géodésiques importantes. Importantes dans le sens où les coefficients de signature ont une variance maximale le long de ces géodésiques. Elles décrivent donc bien les données dans l’espace des coefficients de signature. Ces directions principales peuvent être utilisées pour une interprétation qualitative des données, mais aussi pour la réduction de dimension, comme on le fait avec l’analyse en composantes principales lorsqu’on analyse des données dans un espace Euclidien.


Normalité asymptotique sous dépendance locale, et application aux occurrences de motifs dans les permutations aléatoires

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 8 février 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Dubach Victor Résumé :
Dans cet exposé on commencera par introduire la notion de « graphe de dépendance », qui permet notamment de généraliser le Théorème Central Limite en affaiblissant l’hypothèse d’indépendance. Cette généralisation n’est cependant pas gratuite ; elle requiert notamment une bonne estimation de la variance de la variable d’intérêt. On s’intéressera donc plus précisément au cas des U-statistiques, variables pour lesquelles on peut astucieusement calculer la variance.
Ces considérations pourront s’appliquer à la question du nombre d’occurrences d’un motif donné dans une grande permutation aléatoire. Pour des permutations de loi uniforme, il est bien connu que cette statistique satisfait une normalité asymptotique. À l’aide d’une approche géométrique, on étendra ce résultat aux permutations de loi invariante par conjugaison.

Moyenne et Composantes Principales de séries temporelles, une nouvelle approche avec la méthode de la signature

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 1 février 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Raphael Mignot (IECL) Résumé :

English version below: upon request the presentation can be in english, please let the speaker know a.s.a.p..

L’objectif de notre travail est double : établir un barycentre de séries temporelles multidimensionnelles et trouver des directions d’importance. Nous encodons les séries temporelles avec des intégrales de différents ordres de moments, constituant leur signature.
Tout d’abord, nous avons développé une approche pour calculer la moyenne des coefficients de signature. L’espace des coefficients de signature est une variété avec une structure de groupe mais sans métrique riemannienne bi-invariante, ce qui rend difficile l’utilisation d’approches Riemanniennes classiques.
Ensuite, dans le même esprit que la procédure de calcul de la moyenne, nous cherchons les géodésiques importantes. Importantes dans le sens où les coefficients de signature ont une variance maximale le long de ces géodésiques. Elles décrivent donc bien les données dans l’espace des coefficients de signature. Ces directions principales peuvent être utilisées pour une interprétation qualitative des données, mais aussi pour la réduction de dimension, comme on le fait avec l’analyse en composantes principales lorsqu’on analyse des données dans un espace Euclidien.

 

Title: Mean and Principal Components of time series, a new approach with the signature method.

Abstract: The aim of our work is twofold: average multidimensional time series and find directions of importance. We encode time series with integrals of various moment orders, constituting their signature.
First, we have developed an approach to average signatures coefficients. The space of signature coefficients is a manifold with a group structure but without a bi-invariant Riemannian metric, making it difficult to use classic Riemannian approaches.
Then, in the same spirit as in the averaging procedure, we look for important geodesics. Important in the sense that the signature coefficients have maximum variance along those. Thus, they describe well the data in the space of signature coefficients. Those main directions could be used for a qualitative interpretation of the data but also for dimension reduction, as it is done with the Principal Component Analysis when analyzing data in a Euclidean space.


Réunion d'équipe

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 18 janvier 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Pascal Moyal Résumé :

Le créneau du GDT est reservé pour une réunion d’équipe.


Quelle est la probabilité qu'une formule soit plus simple qu'une autre ?

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 7 décembre 2023 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Pierre Mercuriali (IECL) Résumé :

Je présente ici certains travaux que j’ai effectués lors de ma thèse sur les représentations efficaces de fonctions Booléennes, ainsi que certaines explorations probabilistes que j’ai menées par la suite. Nous pouvons définir une fonction Booléenne {0,1}^n -> {0,1} par sa table de vérité, ce qui est en général plus coûteux que d’en donner une formule, e.g., en forme normale disjonctive ou conjonctive. Je présenterai un cadre de travail général qui permet de comparer, en termes de coût, les différentes manières de définir ces formes normales. La comparaison de certaines formes normales est un problème ouvert. Afin d’y répondre, je présenterai une extension de ce cadre de travail pour étudier la distribution des tailles des formules Booléennes minimales, étant données des contraintes structurelles fortes.


Énumération de cartes et polynômes de Jack.

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 23 novembre 2023 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Houcine Ben Dali (IECL et IRIF Paris) Résumé :
Les cartes combinatoires sont des graphes plongés sur des surface orientables ou non. La théorie de représentation du groupe symétrique permet d’établir plusieurs connexions entre les séries génératrices de cartes et les fonctions de Schur, qui sont une famille de fonction symétriques. Je m’intéresse à deux familles de conjectures qui lient les polynômes de Jack, une déformation à un paramètre des fonctions de Schur, à des séries génératrices de cartes  comptées avec un poids de « non orientabilité ».
Dans cet exposé, je présente une interprétation combinatoire pour les polynômes de Jack en termes de cartes non orientables à niveaux. Ce résultat généralise une formule pour les caractères du groupe symétrique conjecturée par Stanley et démontré par Féray en 2010. Cet exposé repose sur un travail effectué en collaboration avec Maciej Dołęga.

1 2 3 4 5 6 7 8 9 10 11 12