L'IECL

Séminaire Probabilités et Statistique

Séminaire Probabilités et Statistique

Abonnement iCal : iCal

Exposés à venir

Exposés passés

Factorisations de genre fixé d'un grand cycle

8 avril 2021 10:45-11:45 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : Paul Thévenin (Uppsala University)
Résumé :

Une factorisation d’une permutation est une façon d’écrire cette permutation comme un produit de transpositions. L’ensemble des factorisations du n-cycle (12…n), particulièrement étudié en raison notamment de ses liens avec la combinatoire algébrique, est en bijection avec un ensemble de cartes à n sommets, dont le genre est donné par le nombre de transpositions de la factorisation. J’exposerai un algorithme inspiré de cette bijection et permettant de générer une factorisation aléatoire uniforme du n-cycle dont la carte correspondante est de genre fixé.

Je montrerai également comment cet algorithme permet de décrire la limite, en un certain sens, d’une factorisation uniforme de genre donné.

Travail en collaboration avec Valentin Féray et Baptiste Louf.


Multilevel Picard approximations for high-dimensional semilinear parabolic partial differential equations

1 avril 2021 10:45-11:45 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : Thomas Kruse (Justus Liebig University, Giessen)
Résumé :
We present new approximation methods for high-dimensional semilinear parabolic PDEs. A key idea of our methods is to combine multilevel approximations with Picard fixed-point approximations. We prove in the case of semilinear heat equations with Lipschitz continuous nonlinearities that the computational effort of one of the proposed methods grows polynomially both in the dimension and in the reciprocal of the required accuracy. We illustrate the efficiency of the approximation methods by means of numerical simulations. The talk is based on joint works with Weinan E, Martin HutzenthalerArnulf JentzenTuan Nguyen and Philippe Von Wurstemberger.

Rebondissements de mouvements browniens asymétriques

25 mars 2021 09:15-10:15 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : Miguel Martinez
Résumé :
Dans cet exposé nous présenterons des résultats concernant les « rebonds » de deux mouvements browniens asymétriques (ou ‘skew brownian motion’) l’un sur l’autre. Nous verrons que dans une échelle de temps adéquat, la distance entre les deux processus se trouve être solution d’une équation différentielle stochastique à sauts dirigée par le processus des excursions de l’un des deux mouvements, tandis que les rebonds eux-mêmes peuvent se décrire en faisant appel à la théorie des extensions markoviennes des processus auto-similaires. La fin de l’exposé sera consacrée à la présentation de certaines perspectives ouvertes par cette étude.

Mind2Mind: Transfer learning for GANs

25 mars 2021 10:45-11:45 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : Yaël Frégier
Résumé :

In this talk, we will present a new approach to the problem of transfer learning for GANs. It allows training deep neural networks with limited computational resources in the specific context of generative models. We prove rigorously, within the framework of optimal transport, a theorem that ensures the convergence of the learning of the transferred Wasserstein GAN. It is joint work with Jean-Baptiste Gouray


Problèmes de ruine, équation de la chaleur sur un triangle, solutions extrémales et jeux à champs moyen

18 mars 2021 09:15-10:15 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : Nabil Kazi-Tani (ISFA, Université Lyon 1)
Résumé :

Je donnerai dans cet exposé deux exemples de problèmes de contrôle stochastique consistant à optimiser un critère discontinu, dans lesquels d’une part, la fonction valeur peut être obtenue explicitement et d’autre part, le contrôle optimal est extrémal (contrôle bang-bang). Je considèrerai d’abord le problème consistant à minimiser une probabilité de ruine en temps fini pour des martingales browniennes. En calculant explicitement les probabilités de sorties d’un triangle rectangle par le mouvement brownien (en utilisant des résultats connus sur les processus de Bessel), il est possible de montrer que la fonction valeur du problème de contrôle est une solution régulière d’une EDP de la chaleur avec des conditions aux bords discontinues. J’expliquerai en quoi ce problème est utile en assurance, en biologie, ou encore en science politique. Dans un 2e temps, je montrerai comment obtenir des résultats similaires dans des problèmes de jeux différentiels à N joueurs, dont je prendrai une approximation de type champs moyen dans le régime où N est grand. Cet exposé s’appuie sur des travaux en collaboration avec Stefan Ankirchner (Jena), Christophette Blanchet-Scalliet (Lyon), Julian Wendt (Jena) et Chao Zhou (Hong Kong).


Nouveaux développements en statistique grâce à la méthode de Stein

18 mars 2021 10:45-11:45 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : Christophe Ley (Ghent University)
Résumé :

La méthode de Stein est un outil bien connu en probabilités pour construire des bornes précises sur des distances probabilistes. Initialement proposée pour l’approximation gaussienne, elle a par la suite été étendue à bon nombre de lois comme la loi de Poisson, binomiale, exponentielle, variance Gamma, et bien d’autres. Ces dernières années, cette méthode probabiliste a aussi connu un réel succès en statistique et machine learning, et a permis des développements théoriques et computationnels assez spectaculaires. Dans cet exposé, je vais donner un aperçu sur ces développements, avec un focus particulier sur une nouvelle mesure de l’impact du choix de la prior distribution en statistique bayésienne.


Automates cellulaires préservant un sous-shift

11 mars 2021 09:15-10:15 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : Samuel Petite (LAMFA, Amiens)
Résumé :

Les automates cellulaires forment une classe riche de systèmes dynamiques sur l’ensemble des suites symboliques. Ils servent notamment de modèles simplifiés en informatique, pour le calcul parallèle, et en physique statistique, pour étudier l’évolution de systèmes de particules. Un problème classique consiste alors à étudier les environnements laissés stable par l’évolution d’un ou plusieurs automates et en particuliers leurs mesures invariantes ou les distributions asymptotiques des itérés des automates sur une configuration aléatoire. Nous présenterons dans cet exposé plusieurs restrictions sur ces automates en fonction de la complexité de l’environnement.


Sous-diffusion de l’énergie dans des systèmes Hamiltoniens uni-dimensionnels

11 mars 2021 10:45-11:45 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : François Huveneers (CEREMADE, Paris-Dauphine)
Résumé :

Dans cet exposé, on s’intéressera à un problème de physique statistique hors équilibre : la propagation de l’énergie dans des chaînes d’oscillateurs, classiques ou quantiques, en dimension 1. Si l’énergie est l’unique quantité conservée, on s’attend dans la plupart des cas à observer un transport diffusif. Néanmoins, si le milieu est désordonné, il est possible d’observer une absence totale de transport (localisation d’Anderson et localisation à N corps), ou un transport plus lent que diffusif, dû à la présence de goulots. J’expliquerai la phénoménologie et je donnerai un modèle Hamiltonien où on peut obtenir un résultat mathématique rigoureux. L’exposé se base sur un travail en collaboration avec Wojciech De Roeck et Stefano Olla.


Multiple Partition Clustering

18 février 2021 10:45-11:45 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : Vincent Vandewalle (Université de Lille)
Résumé :

This talk deals with clustering when several latent class variables are considered (multiple partition clustering). Indeed, assuming that all heterogeneity in the data can be explained by one single variable is very strong, and it can be useful to consider that several blocks (or linear combinations) of variables can provide different partitions of individuals. This can reveal new lines of analysis in the data. In this framework, we present two approaches. The first one assumes the existence of several groups of variables, each leading to a different partition of the individuals [1]. It makes it possible to classify the variables into blocks, each producing a specific grouping of individuals. The model assumes the independence between blocks of variables, and in each block the independence of the variables given the cluster. An efficient approach is proposed to search for the blocks of variables as well as performing the estimation of the different partitions of the individuals. The second one assumes the existence of several classifying projections in the data [2]. It makes it possible to obtain different classifying projections and the associated partitions. The model assumes that the data are obtained based on linear combinations of classifying and non classifying variables, where each classifying variable is assumed to follow a specific mixture distribution. The parameters of the models are estimated through a generalized EM algorithm. The behavior of these models will be illustrated in simulated and real data. We will discuss how using such kind of models can give new insight from the data analysis point of view, and can be considered for further investigation. References: [1] Marbac, M. and Vandewalle, V. (2019). “A tractable multi-partitions clustering”. In: Computational Statistics & Data Analysis 132, pp. 167–179. [2] Vandewalle, V. (2020). “Multi-Partitions Subspace Clustering”. In: Mathematics 8.4, p. 597.


Estimation non paramétrique pour des flux de données

11 février 2021 10:45-11:45 - Salle de probabilités et statistique virtuelle
Oratrice ou orateur : Amir Aboubacar (Université de Lille)
Résumé :

Dans cet exposé, nous nous intéresserons à l’estimation fonctionnelle dans un cadre non paramétrique pour des flux de données. Nous donnerons une définition et une modélisation statistique de ce type de données. Nous présenterons brièvement quelques questions relatives à l’estimation non paramétrique, lorsque l’échantillon d’apprentissage est de nature temporelle, spatiale ou spatio-temporelle et se présente sous forme de flux de données. Nous considérerons le cas d’un modèle statistique dans lequel la variable aléatoire générique est multivariée, circulaire ou de nature fonctionnelle. Des modèles classiques seront revisités dans le contexte de flux de données, et leurs propriétés asymptotiques étudiées, notamment lorsque le processus générateur des données est stationnaire ou localement stationnaire.


Distributions de Tracy-Widom d'ordre supérieur

28 janvier 2021 10:45-11:45 -
Oratrice ou orateur : Mattia Cafasso
Résumé :

Dans un article publié en 2018, Le Doussal Majumdar et Schehr ont introduit une famille de distributions, indexées par un entier positif n, qui généralisent la célèbre distribution de Tracy-Widom (GUE) décrivant la loi limite de la plus grande valeur propre d’une matrice aléatoire. Plus récemment, les mêmes distributions sont apparues aussi dans la théorie des partitions aléatoires. Après une bref introduction concernant leur applications, j’illustrerai les résultats que j’ai obtenu en collaboration avec Tom Claeys et Manuela Girotti sur les grandes déviations associées à  ces distributions, et leur liens avec les équations de Painlevé.


Quelques développements récents en matière de gestion et de surveillance des ressources naturelles

21 janvier 2021 10:45-11:45 -
Oratrice ou orateur : Thibaut Mastrolia
Résumé :

Dans cet exposé, nous étudions l’impact d’une politique de surveillance proposée à  un agent exploitant une ressource naturelle renouvelable. Nous adoptons un modèle principal/agent en temps continu dans lequel le principal conçoit un contrat, c’est-à -dire une politique de taxes/compensations, conduisant l’agent à  un niveau d’exploitation donné. Pour un contrat donné, nous décrivons d’abord l’effort optimal de l’agent en utilisant la théorie des EDSR. Sous des hypothèses de régularité sur les coefficients, nous exprimons ensuite le contrat optimal comme la solution d’une équation d’Hamilton Jacobi Bellman. Nous étendons ensuite le résultat à  des coefficients non réguliers en fournissant des stratégies epsilon optimales à  l’aide d’un résultat d’approximation pour la fonction de valeur du régulateur. Travaux conjoints avec Idris Kharroubi (Sorbonne Université) et Thomas Lim (ENSIIE).


Global sensitivity analysis for models described by stochastic differential equations

14 janvier 2021 10:45-11:45 -
Oratrice ou orateur : Pierre Étoré
Résumé :

Many mathematical models involve input parameters, which are not precisely known. Global sensitivity analysis aims to identify the parameters whose uncertainty has the largest impact on the variability of a quantity of interest. One of the statistical tools used to quantify the influence of each input variable on the quantity of interest are the Sobol’ sensitivity indices. In this paper, we consider stochastic models described by stochastic differential equations (SDE). We focus the study on mean quantities, defined as the expectation with respect to the Wiener measure of a quantity of interest related to the solution of the SDE itself. Our approach is based on a Feynman-Kac representation of the quantity of interest, from which we get a parametrized partial differential equation (PDE) representation of our initial problem. We then handle the uncertainty on the parametrized PDE using polynomial chaos expansion and a stochastic Galerkin projection.

Talk will be in French


Asymétrie dans la division cellulaire, étude théorique et numérique

7 janvier 2021 10:45-11:45 -
Oratrice ou orateur : Benoîte de Saporta
Résumé :

Ce travail est motivé par l’existence d’asymétrie lors de la division cellulaire. Après avoir examiné cette asymétrie sur des données expérimentales, nous introduisons un modèle probabiliste décrivant les divisions successives de cellules et prenant en compte deux types d’asymétrie: une asymétrie physiologique décrivant le fait que deux cellules soeurs peuvent grandir à  des vitesses différentes, et une asymétrie morphologique décrivant le fait que les tailles des deux cellules soeurs à  la division sont différentes. Dans un premier temps, nous expliciterons le caractère Malthusien de la dynamique, au sens o๠la taille de la population croit exponentiellement tandis que la distribution des tailles converge vers une distribution stable. Dans un second temps, nous étudierons les fluctuation du paramètre Malthusien en fonction des différents paramètres du modèle. Nous montrerons que sous certaines hypothèses, l’asymétrie est optimale au sens Darwinien. Ce travail est toujours en cours et est en collaboration avec Bertrand Cloez (INRAE Montpellier) et Tristan Roget (Univ. Montpellier).


Quelques modèles de régression extrême (2ème tour après gros problème technique)

17 décembre 2020 10:45-11:45 -
Oratrice ou orateur : Antoine Usseglio-Carleve
Résumé :

Si estimer la médiane (quantile de niveau 0.5) ou le quartile (quantile de niveau 0.25 ou 0.75) d’une variable aléatoire Y paraît évident lorsque l’on dispose d’un échantillon de taille n, qu’en est-il si le niveau de quantile que l’on cherche à  estimer dépasse 1-1/n ? Dans ce cas, l’usage de la classique statistique d’ordre renvoie systématiquement le maximum de l’échantillon, et mène alors à  une estimation non-consistante du quantile désiré. Grâce à  la théorie des valeurs extrêmes, on trouve dans la littérature des méthodes d’extrapolation pour estimer de tels quantiles. La particularité de ce travail est que la variable d’intérêt Y est impactée par un vecteur de covariables X. L’enjeu est alors d’estimer des quantiles extrêmes de la loi conditionnelle de Y sachant X=x. Pour cela, on propose d’abord une approche de régression purement non-paramétrique, en proposant des estimateurs de quantile et d’expectile (une alternative au quantile que l’on introduira) extrêmes, et en étudiant leurs propriétés asymptotiques. La vitesse de convergence de ces estimateurs se dégradant assez fortement lorsque la taille de la covariable X augmente, on proposera alors quelques modèles sur X et Y permettant de contourner le fléau de la dimension. Quelques applications en assurance ou catastrophe naturelle seront proposées.


Quelques modèles de régression extrême

10 décembre 2020 10:45-11:45 -
Oratrice ou orateur : Antoine Usseglio-Carleve
Résumé :

Si estimer la médiane (quantile de niveau 0.5) ou le quartile (quantile de niveau 0.25 ou 0.75) d’une variable aléatoire Y paraît évident lorsque l’on dispose d’un échantillon de taille n, qu’en est-il si le niveau de quantile que l’on cherche à  estimer dépasse 1-1/n ? Dans ce cas, l’usage de la classique statistique d’ordre renvoie systématiquement le maximum de l’échantillon, et mène alors à  une estimation non-consistante du quantile désiré. Grâce à  la théorie des valeurs extrêmes, on trouve dans la littérature des méthodes d’extrapolation pour estimer de tels quantiles. La particularité de ce travail est que la variable d’intérêt Y est impactée par un vecteur de covariables X. L’enjeu est alors d’estimer des quantiles extrêmes de la loi conditionnelle de Y sachant X=x. Pour cela, on propose d’abord une approche de régression purement non-paramétrique, en proposant des estimateurs de quantile et d’expectile (une alternative au quantile que l’on introduira) extrêmes, et en étudiant leurs propriétés asymptotiques. La vitesse de convergence de ces estimateurs se dégradant assez fortement lorsque la taille de la covariable X augmente, on proposera alors quelques modèles sur X et Y permettant de contourner le fléau de la dimension. Quelques applications en assurance ou catastrophe naturelle seront proposées.


Transport optimal martingale et construction de couplages

3 décembre 2020 10:45-11:45 -
Oratrice ou orateur : Nicolas Juillet
Résumé :

Le problème du transport optimal de Monge, sous sa forme « Kantorovich », se formule particulièrement bien en termes probabilistes puisqu’il consiste à  minimiser l’espérance de la distance (ou d’une autre fonction) de deux variables aléatoires dont les marges, les fameux « déblais » et « remblais », sont des données du problème. En somme il s’agit de trouver un couplage (un transport, une loi jointe) optimal(e). Je parlerai de certains de mes travaux sur la variante « martingale » du problème et des couplages spécifiques (dernièrement d’une infinité indénombrable de lois) qui en ont émergé. Des liens avec le problème de plongement de Skorokhod et certaines représentations de Choquet seront évoqués. Travaux en collaboration avec Mathias Beiglböck, et plus récemment avec Martin Huesmann et Martin Brà¼ckerhoff.


Simulation exacte du temps nécessaire à  une diffusion pour sortir d'un intervalle

26 novembre 2020 10:45-11:45 -
Oratrice ou orateur : Samuel Herrmann
Résumé :

Les diffusions (famille de solutions d’équations différentielles stochastiques) jouent un rôle primordial en modélisation stochastique avec de nombreux champs d’application. Il est donc essentiel de pouvoir simuler précisément les trajectoires de ces processus et toute variable aléatoire qui y serait liée. Dans cette communication, nous nous intéresserons en particulier au premier instant de sortie d’un intervalle donné. Nous considérons donc (Xt) la solution de dXt = μ(Xt)dt + dBt, X0 ∈ ]a,b[, t≥0, o๠(Bt) est un mouvement brownien et l’objectif se résume à  la simulation numérique de Ï„_ab = inf{t≥0: Xt ∉ ]a,b[}. Cette variable aléatoire dépend de la trajectoire du processus et non simplement d’une marginale à  un temps fixé, ce qui rend plus compliquée sa simulation numérique. Une première approche consiste à  introduire des schémas numériques basés sur la discrétisation temporelle. Ces schemas permettent d’obtenir un squelette de la diffusion et d’en déduire une approximation du temps de sortie. Une autre façon d’appréhender le problème de simulation est d’utiliser une méthode de rejet pour simuler directement et de façon exacte le temps de sortie. C’est cette méthode que je souhaite vous présenter. Une première étude sur la simulation exacte notamment des marginales de diffusion fut introduite par Beskos et Roberts puis complétée par différents travaux par la suite. En ce qui concerne les temps d’arrêt, Cristina Zucca et moi-même avons étudié dans un premier temps les premiers instants de passage des diffusions avant de nous intéresser aux temps de sortie dont la complexité (au niveau des algorithmes) est bien supérieure. Références : https://dev-iecl.univ-lorraine.fr/ProbaStat/covid/downloads/2020-11-26_Samuel_Herrmann_abstract.pdf


Schémas préservant l'asymptotique pour quelques modèles stochastiques

19 novembre 2020 10:45-11:45 -
Oratrice ou orateur : Charles-Edouard Bréhier
Résumé :

On considère des systèmes multiéchelles d’Equations Différentielles Stochastiques: quand un paramètre epsilon tend vers 0, la composante lente converge soit vers la solution d’une équation différentielle ordinaire (principe de moyennisation), soit vers la solution d’une équation différentielle stochastique (approximation diffusion). L’objectif d’un schéma préservant l’aymptotique est d’être consistent pour tout epsilon, et d’admettre un schéma limite quand epsilon tend vers 0, qui soit consistent avec l’équation limite au niveau continu.

On verra que pour les modèles EDS la consistance du schéma limite avec l’équation limite n’est pas évidente: par exemple, le schéma limite peut être naturellement associé à  une interprétation Itô du bruit, alors que l’équation limite est associée à  l’interprétation Stratonovich. On décrira des exemples et contre-exemples de schémas préservant l’asymptotique.

Enfin, on montrera (dans le régime moyennisation) une estimation d’erreur uniforme par rapport à  epsilon, en fonction du pas de temps: le schéma est uniformément précis.

Il s’agit d’un travail en collaboration avec Shmuel Rakotonirina-Ricquebourg (Lyon 1).


Graphes de dépendance (pondérés) et normalité asymptotique

12 novembre 2020 10:45-11:45 -
Oratrice ou orateur : Valentin Féray
Résumé :

Le but de cet exposé est de présenter la théorie des graphes de dépendance et une extension pondérée que j’ai récemment introduite. Ces théories donne des critères de normalité asymptotique pour des sommes de variables aléatoires faiblement dépendantes. Elle s’applique en particulier aux nombres de sous-structures de taille fixée dans des objets combinatoires aléatoires ou des modèles de physique statistique. L’exposé sera illustré par des exemples de compte de sous-mots dans des mots aléatoires et des applications à  un système de particule (SSEP, symmetric simple exclusion process) et au modèle d’Ising.


1 2 3 4 5 6 7 8 9 10 11 12