Archive 2021

Asymétrie dans la division cellulaire, étude théorique et numérique

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 7 janvier 2021 10:45-11:45 Lieu : Oratrice ou orateur : Benoîte de Saporta Résumé :

Ce travail est motivé par l’existence d’asymétrie lors de la division cellulaire. Après avoir examiné cette asymétrie sur des données expérimentales, nous introduisons un modèle probabiliste décrivant les divisions successives de cellules et prenant en compte deux types d’asymétrie: une asymétrie physiologique décrivant le fait que deux cellules soeurs peuvent grandir à  des vitesses différentes, et une asymétrie morphologique décrivant le fait que les tailles des deux cellules soeurs à  la division sont différentes. Dans un premier temps, nous expliciterons le caractère Malthusien de la dynamique, au sens o๠la taille de la population croit exponentiellement tandis que la distribution des tailles converge vers une distribution stable. Dans un second temps, nous étudierons les fluctuation du paramètre Malthusien en fonction des différents paramètres du modèle. Nous montrerons que sous certaines hypothèses, l’asymétrie est optimale au sens Darwinien. Ce travail est toujours en cours et est en collaboration avec Bertrand Cloez (INRAE Montpellier) et Tristan Roget (Univ. Montpellier).


Aux origines quantiques des processus déterminantaux.

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 14 janvier 2021 09:15-10:15 Lieu : Oratrice ou orateur : Rémi Peyre Résumé :

En théorie des probabilités, divers processus ponctuels — dont, par exemple, l’ensemble des valeurs propres de l’« ensemble gaussien unitaire » (GUE) — sont dits « déterminantaux », c’est à  dire qu’ils vérifient la propriété suivante : pour x1, …, xn des points, la probabilité que le processus charge simultanément tous ces points est de la forme « det ⸨K(xi, xj)⸩i,j » — o๠le noyau K a parfois une forme particulièrement alambiquée, même pour des processus assez simples… Si vous avez déjà  rencontré cette définition au détour d’une conférence, elle vous aura sans doute semblé fort mystérieuse : pourquoi avoir introduit cette notion de processus déterminantal ; d’o๠vient que certains processus naturels se mettent sous cette forme ; en quoi cette définition est-elle susceptible de donner des propriétés intéressantes ; … ?

J’apporterai quelques éléments de réponse à  ces questions en m’appuyant sur l’article fondateur du concept de processus déterminantal [Benard & Macchi 1973], article qui traitait de… physique quantique ! En effet, il s’avère que les processus déterminantaux sont essentiellement ceux qui décrivent les positions d’un type de particules quantiques appelées fermions, dont l’état vit dans la partie antisymétrique d’une puissance tensorielle d’espace hilbertien (!).

Bien entendu, toutes ces notions seront expliquées au cours de l’exposé, dont la présentation sera orientée selon un angle aussi mathématique que possible. à€ noter que du point de vue technique, il y aura finalement assez peu de probabilités dans ce que je vais raconter (car ici on se contentera de justifier l’intérêt d’étudier les processus déterminantaux : or les probabilités interviennent surtout ensuite, lors de l’étude à  proprement parler) ; par contre, préparez-vous à  subir une bonne dose d’analyse hilbertienne complexe…!


Global sensitivity analysis for models described by stochastic differential equations

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 14 janvier 2021 10:45-11:45 Lieu : Oratrice ou orateur : Pierre Étoré Résumé :

Many mathematical models involve input parameters, which are not precisely known. Global sensitivity analysis aims to identify the parameters whose uncertainty has the largest impact on the variability of a quantity of interest. One of the statistical tools used to quantify the influence of each input variable on the quantity of interest are the Sobol’ sensitivity indices. In this paper, we consider stochastic models described by stochastic differential equations (SDE). We focus the study on mean quantities, defined as the expectation with respect to the Wiener measure of a quantity of interest related to the solution of the SDE itself. Our approach is based on a Feynman-Kac representation of the quantity of interest, from which we get a parametrized partial differential equation (PDE) representation of our initial problem. We then handle the uncertainty on the parametrized PDE using polynomial chaos expansion and a stochastic Galerkin projection.

Talk will be in French


Quelques développements récents en matière de gestion et de surveillance des ressources naturelles

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 21 janvier 2021 10:45-11:45 Lieu : Oratrice ou orateur : Thibaut Mastrolia Résumé :

Dans cet exposé, nous étudions l’impact d’une politique de surveillance proposée à  un agent exploitant une ressource naturelle renouvelable. Nous adoptons un modèle principal/agent en temps continu dans lequel le principal conçoit un contrat, c’est-à -dire une politique de taxes/compensations, conduisant l’agent à  un niveau d’exploitation donné. Pour un contrat donné, nous décrivons d’abord l’effort optimal de l’agent en utilisant la théorie des EDSR. Sous des hypothèses de régularité sur les coefficients, nous exprimons ensuite le contrat optimal comme la solution d’une équation d’Hamilton Jacobi Bellman. Nous étendons ensuite le résultat à  des coefficients non réguliers en fournissant des stratégies epsilon optimales à  l’aide d’un résultat d’approximation pour la fonction de valeur du régulateur. Travaux conjoints avec Idris Kharroubi (Sorbonne Université) et Thomas Lim (ENSIIE).


Distributions de Tracy-Widom d'ordre supérieur

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 28 janvier 2021 10:45-11:45 Lieu : Oratrice ou orateur : Mattia Cafasso Résumé :

Dans un article publié en 2018, Le Doussal Majumdar et Schehr ont introduit une famille de distributions, indexées par un entier positif n, qui généralisent la célèbre distribution de Tracy-Widom (GUE) décrivant la loi limite de la plus grande valeur propre d’une matrice aléatoire. Plus récemment, les mêmes distributions sont apparues aussi dans la théorie des partitions aléatoires. Après une bref introduction concernant leur applications, j’illustrerai les résultats que j’ai obtenu en collaboration avec Tom Claeys et Manuela Girotti sur les grandes déviations associées à  ces distributions, et leur liens avec les équations de Painlevé.


Sélection de variables dans la fonction de discrépance associée à un simulateur

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 11 février 2021 09:15-10:15 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Pierre Barbillon (AgroParisTech) Résumé :

Le modèle statistique qui relie des expériences physiques à un simulateur contient souvent une fonction de discrépance. La fonction de discrépance permet de modéliser l’écart systématique entre le simulateur et le phénomène réel. Étudier la fonction de discrépance aide à comprendre à quel point le simulateur est fiable. En particulier, déterminer que certaines variables d’entrées sont actives ou inertes dans la fonction de discrépance comporte un intérêt majeur puisque cela indique quelles variables sont correctement modélisées ou non par le simulateur. Ainsi, cela permettrait d’avoir des informations afin d’améliorer le simulateur et aiderait à décider si l’extrapolation dans certaines directions est risquée ou non. La fonction de discrépance est modélisée comme un processus gaussien paramétré comme dans l’article de Linkletter et al. (2006). Cette paramétrisation a pour intérêt d’avoir une distinction simple entre une variable active et une variable inerte. La procédure de sélection de variables repose sur une méthode de sélection de modèles où les modèles en compétition diffèrent sur les distributions a priori choisies pour les paramètres liés aux variables d’entrées. Nous nous appuyons sur le facteur de Bayes calculé efficacement par une procédure de « Bridge Sampling » pour effectuer la sélection de modèle. Des exemples artificiels sont utilisés pour faire la preuve de l’efficacité de la méthode et celle-ci sera appliquée à un simulateur permettant de prévoir la production d’énergie photovoltaïque. Travail en collaboration avec Anabel Forte et Rui Paulo.


Estimation non paramétrique pour des flux de données

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 11 février 2021 10:45-11:45 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Amir Aboubacar (Université de Lille) Résumé :

Dans cet exposé, nous nous intéresserons à l’estimation fonctionnelle dans un cadre non paramétrique pour des flux de données. Nous donnerons une définition et une modélisation statistique de ce type de données. Nous présenterons brièvement quelques questions relatives à l’estimation non paramétrique, lorsque l’échantillon d’apprentissage est de nature temporelle, spatiale ou spatio-temporelle et se présente sous forme de flux de données. Nous considérerons le cas d’un modèle statistique dans lequel la variable aléatoire générique est multivariée, circulaire ou de nature fonctionnelle. Des modèles classiques seront revisités dans le contexte de flux de données, et leurs propriétés asymptotiques étudiées, notamment lorsque le processus générateur des données est stationnaire ou localement stationnaire.


Titre à venir

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 18 février 2021 09:15-10:15 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Gilles Stupfler (ENSAI, Rennes) Résumé :

à venir


Multiple Partition Clustering

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 18 février 2021 10:45-11:45 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Vincent Vandewalle (Université de Lille) Résumé :

This talk deals with clustering when several latent class variables are considered (multiple partition clustering). Indeed, assuming that all heterogeneity in the data can be explained by one single variable is very strong, and it can be useful to consider that several blocks (or linear combinations) of variables can provide different partitions of individuals. This can reveal new lines of analysis in the data. In this framework, we present two approaches. The first one assumes the existence of several groups of variables, each leading to a different partition of the individuals [1]. It makes it possible to classify the variables into blocks, each producing a specific grouping of individuals. The model assumes the independence between blocks of variables, and in each block the independence of the variables given the cluster. An efficient approach is proposed to search for the blocks of variables as well as performing the estimation of the different partitions of the individuals. The second one assumes the existence of several classifying projections in the data [2]. It makes it possible to obtain different classifying projections and the associated partitions. The model assumes that the data are obtained based on linear combinations of classifying and non classifying variables, where each classifying variable is assumed to follow a specific mixture distribution. The parameters of the models are estimated through a generalized EM algorithm. The behavior of these models will be illustrated in simulated and real data. We will discuss how using such kind of models can give new insight from the data analysis point of view, and can be considered for further investigation. References: [1] Marbac, M. and Vandewalle, V. (2019). “A tractable multi-partitions clustering”. In: Computational Statistics & Data Analysis 132, pp. 167–179. [2] Vandewalle, V. (2020). “Multi-Partitions Subspace Clustering”. In: Mathematics 8.4, p. 597.


Automates cellulaires préservant un sous-shift

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 11 mars 2021 09:15-10:15 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Samuel Petite (LAMFA, Amiens) Résumé :

Les automates cellulaires forment une classe riche de systèmes dynamiques sur l’ensemble des suites symboliques. Ils servent notamment de modèles simplifiés en informatique, pour le calcul parallèle, et en physique statistique, pour étudier l’évolution de systèmes de particules. Un problème classique consiste alors à étudier les environnements laissés stable par l’évolution d’un ou plusieurs automates et en particuliers leurs mesures invariantes ou les distributions asymptotiques des itérés des automates sur une configuration aléatoire. Nous présenterons dans cet exposé plusieurs restrictions sur ces automates en fonction de la complexité de l’environnement.


Sous-diffusion de l’énergie dans des systèmes Hamiltoniens uni-dimensionnels

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 11 mars 2021 10:45-11:45 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : François Huveneers (CEREMADE, Paris-Dauphine) Résumé :

Dans cet exposé, on s’intéressera à un problème de physique statistique hors équilibre : la propagation de l’énergie dans des chaînes d’oscillateurs, classiques ou quantiques, en dimension 1. Si l’énergie est l’unique quantité conservée, on s’attend dans la plupart des cas à observer un transport diffusif. Néanmoins, si le milieu est désordonné, il est possible d’observer une absence totale de transport (localisation d’Anderson et localisation à N corps), ou un transport plus lent que diffusif, dû à la présence de goulots. J’expliquerai la phénoménologie et je donnerai un modèle Hamiltonien où on peut obtenir un résultat mathématique rigoureux. L’exposé se base sur un travail en collaboration avec Wojciech De Roeck et Stefano Olla.


Problèmes de ruine, équation de la chaleur sur un triangle, solutions extrémales et jeux à champs moyen

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 18 mars 2021 09:15-10:15 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Nabil Kazi-Tani (ISFA, Université Lyon 1) Résumé :

Je donnerai dans cet exposé deux exemples de problèmes de contrôle stochastique consistant à optimiser un critère discontinu, dans lesquels d’une part, la fonction valeur peut être obtenue explicitement et d’autre part, le contrôle optimal est extrémal (contrôle bang-bang). Je considèrerai d’abord le problème consistant à minimiser une probabilité de ruine en temps fini pour des martingales browniennes. En calculant explicitement les probabilités de sorties d’un triangle rectangle par le mouvement brownien (en utilisant des résultats connus sur les processus de Bessel), il est possible de montrer que la fonction valeur du problème de contrôle est une solution régulière d’une EDP de la chaleur avec des conditions aux bords discontinues. J’expliquerai en quoi ce problème est utile en assurance, en biologie, ou encore en science politique. Dans un 2e temps, je montrerai comment obtenir des résultats similaires dans des problèmes de jeux différentiels à N joueurs, dont je prendrai une approximation de type champs moyen dans le régime où N est grand. Cet exposé s’appuie sur des travaux en collaboration avec Stefan Ankirchner (Jena), Christophette Blanchet-Scalliet (Lyon), Julian Wendt (Jena) et Chao Zhou (Hong Kong).


Nouveaux développements en statistique grâce à la méthode de Stein

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 18 mars 2021 10:45-11:45 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Christophe Ley (Ghent University) Résumé :

La méthode de Stein est un outil bien connu en probabilités pour construire des bornes précises sur des distances probabilistes. Initialement proposée pour l’approximation gaussienne, elle a par la suite été étendue à bon nombre de lois comme la loi de Poisson, binomiale, exponentielle, variance Gamma, et bien d’autres. Ces dernières années, cette méthode probabiliste a aussi connu un réel succès en statistique et machine learning, et a permis des développements théoriques et computationnels assez spectaculaires. Dans cet exposé, je vais donner un aperçu sur ces développements, avec un focus particulier sur une nouvelle mesure de l’impact du choix de la prior distribution en statistique bayésienne.


Rebondissements de mouvements browniens asymétriques

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 25 mars 2021 09:15-10:15 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Miguel Martinez Résumé :
Dans cet exposé nous présenterons des résultats concernant les « rebonds » de deux mouvements browniens asymétriques (ou ‘skew brownian motion’) l’un sur l’autre. Nous verrons que dans une échelle de temps adéquat, la distance entre les deux processus se trouve être solution d’une équation différentielle stochastique à sauts dirigée par le processus des excursions de l’un des deux mouvements, tandis que les rebonds eux-mêmes peuvent se décrire en faisant appel à la théorie des extensions markoviennes des processus auto-similaires. La fin de l’exposé sera consacrée à la présentation de certaines perspectives ouvertes par cette étude.

Mind2Mind: Transfer learning for GANs

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 25 mars 2021 10:45-11:45 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Yaël Frégier Résumé :

In this talk, we will present a new approach to the problem of transfer learning for GANs. It allows training deep neural networks with limited computational resources in the specific context of generative models. We prove rigorously, within the framework of optimal transport, a theorem that ensures the convergence of the learning of the transferred Wasserstein GAN. It is joint work with Jean-Baptiste Gouray


Multilevel Picard approximations for high-dimensional semilinear parabolic partial differential equations

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 1 avril 2021 10:45-11:45 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Thomas Kruse (Justus Liebig University, Giessen) Résumé :
We present new approximation methods for high-dimensional semilinear parabolic PDEs. A key idea of our methods is to combine multilevel approximations with Picard fixed-point approximations. We prove in the case of semilinear heat equations with Lipschitz continuous nonlinearities that the computational effort of one of the proposed methods grows polynomially both in the dimension and in the reciprocal of the required accuracy. We illustrate the efficiency of the approximation methods by means of numerical simulations. The talk is based on joint works with Weinan E, Martin HutzenthalerArnulf JentzenTuan Nguyen and Philippe Von Wurstemberger.

Factorisations de genre fixé d'un grand cycle

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 8 avril 2021 10:45-11:45 Lieu : Salle de probabilités et statistique virtuelle Oratrice ou orateur : Paul Thévenin (Uppsala University) Résumé :

Une factorisation d’une permutation est une façon d’écrire cette permutation comme un produit de transpositions. L’ensemble des factorisations du n-cycle (12…n), particulièrement étudié en raison notamment de ses liens avec la combinatoire algébrique, est en bijection avec un ensemble de cartes à n sommets, dont le genre est donné par le nombre de transpositions de la factorisation. J’exposerai un algorithme inspiré de cette bijection et permettant de générer une factorisation aléatoire uniforme du n-cycle dont la carte correspondante est de genre fixé.

Je montrerai également comment cet algorithme permet de décrire la limite, en un certain sens, d’une factorisation uniforme de genre donné.

Travail en collaboration avec Valentin Féray et Baptiste Louf.


Strong laws for growth-fragmentation processes with bounded cell size

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 6 mai 2021 10:45-11:45 Lieu : Teams Oratrice ou orateur : Alex Watson (University College London) Résumé :

A growth-fragmentation is a stochastic process representing cells with continuously growing mass, which experience sudden splitting events. Growth-fragmentations are used to model cell division and protein polymerisation in biophysics. It is interesting to ask whether these processes converge toward an equilibrium, in which the number of cells is growing exponentially and the distribution of cell sizes approaches some fixed asymptotic profile. In this work, we study a process in which the growth and splitting of an individual cell is largely independent of its mass, with the exception that the mass is bounded above, so it cannot exceed a given constant. We give precise conditions to ensure that, almost surely, the process exhibits this equilibrium behaviour, and express the asymptotic profile in terms of an underlying Lévy process.

This is joint work with Emma Horton (Inria Bordeaux).


Principe de grande déviation pour les courants et le flot maximal en percolation de premier passage

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 20 mai 2021 10:45-11:45 Lieu : Teams Oratrice ou orateur : Barbara Dembin (LPSM, Paris) Résumé :

Considérons la percolation de premier passage dans le réseau renormalisé Z^d/n pour d>=2 : à chaque arête e, on associe une capacité aléatoire c(e)>=0 de telle sorte que la famille (c(e))_e soit indépendante et identiquement distribuée selon une loi G. On peut interpréter cette capacité comme un débit maximal, i.e., la quantité maximale d’eau pouvant traverser l’arête par unité de temps. Considérons un domaine borné et connecté Ω de R^d et deux ensembles disjoints du bord de Ω : un part lequel l’eau peut entrer (la source) et un part lequel l’eau peut sortir (le puits). Nous nous intéressons au flot maximal : la quantité maximale d’eau pouvant entrer dans Ω par unité de temps. Un courant est une fonction sur les arêtes qui décrit la façon dont l’eau circule dans Ω. Dans cet exposé, nous présenterons un principe de grande déviation pour les courants et nous en déduirons par un principe de contraction un principe de grande déviation pour le flot maximal dans Ω.
Travail en collaboration avec Marie Théret.


Langevin processes in bounded-in-position domains: application to quasi-stationary distributions

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 27 mai 2021 10:45-11:45 Lieu : Teams Oratrice ou orateur : Mouad Ramil (CERMICS, Ecole des Ponts ParisTech) Résumé :

Quasi-stationary distributions can be seen as the first eigenvector associated with the generator of the stochastic differential equation at hand, on a domain with Dirichlet boundary conditions (which corresponds to absorbing boundary conditions at the level of the underlying stochastic processes). Many results on the quasi-stationary distribution hold for non degenerate stochastic dynamics, whose associated generator is elliptic. The case of degenerate dynamics is less clear. In this work, together with T. Lelièvre and J. Reygner (Ecole des Ponts, France) we generalize well-known results on the probabilistic representation of solutions to parabolic equations on bounded domains to the so-called kinetic Fokker-Planck equation on bounded domains in positions, with absorbing boundary conditions. Furthermore, a Harnack inequality, as well as a maximum principle, is provided for solutions to this kinetic Fokker-Planck equation, as well as the existence of a smooth transition density for the associated absorbed Langevin dynamics. The continuity of this transition density at the boundary is studied as well as the compactness, in various functional spaces, of the associated semigroup. This work is a cornerstone to prove the consistency of some algorithms used to simulate metastable trajectories of the Langevin dynamics, for example the Parallel Replica algorithm.


Systèmes de processus de renforcement en interaction

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 3 juin 2021 10:45-11:45 Lieu : Teams Oratrice ou orateur : Pierre-Yves Louis (IMB, Dijon) Résumé :

Les modèles d’urnes sont utilisés dans de nombreuses applications et sont un exemple fondamental de processus stochastiques de renforcement. En partant de ces modèles, nous nous intéresserons à plusieurs familles de systèmes (finis) de processus de renforcement. Différents résultats sur le comportement collectif en temps long seront présentés. La présence/absence de synchronisation sera discutée, ainsi que les vitesses de convergence en fonction de différents régimes de paramètres. Cet exposé se fonde sur des travaux en collaboration avec I. Crimaldi, P. Dai Pra, I. Minelli et M. Mirebrahimi.


Introduction à la combinatoire analytique.

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 10 juin 2021 09:15-10:15 Lieu : Oratrice ou orateur : Mathilde Bouvel Résumé :

La combinatoire analytique est une théorie développée par Philippe Flajolet et son école, dont l’idée centrale est d’obtenir des propriétés de familles d’objets discrets en étudiant leurs séries génératrices vues comme des fonctions d’une variable complexe. Il s’agit le plus souvent d’obtenir l’énumération asymptotique de la famille considérée. En considérant des séries génératrices bivariées, on peut aussi obtenir des informations sur le comportement limite de statistiques sur les objets considérés.
Dans cet exposé, j’essaierai de faire un panorama des théorèmes principaux de la combinatoire analytique, illustré de quelques exemples, et en donnant quelques éléments de preuve. Une partie de l’exposé est préparatoire à la séance 2, où l’on utilisera l’énumération asymptotique d’une certaine famille d’arbres dans la preuve de la limite en graphon des cographes.


Reduction of a stochastic hybrid model of gene expression using Large deviations theory

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 10 juin 2021 10:45-11:45 Lieu : Teams Oratrice ou orateur : Elias Ventre (LBMC, ENS Lyon) Résumé :

Differentiation is the process whereby a cell acquires a specific phenotype, by differential gene expression as a function of time. This is thought to result from the dynamical functioning of an underlying Gene Regulatory Network (GRN). The precise path from the stochastic GRN behavior to the resulting cell state is still an open question. In this presentation, we detail a methodology to reduce a mechanistic model characterizing the evolution of a cell by a system of piecewise deterministic Markov processes (PDMP), to a discrete coarse-grained model on a limited number of cell types, defined as the basins of attraction of the deterministic limit. The transitions between the basins in the weak noise limit can be determined by the unique solution of an Hamilton-Jacobi equation under a particular constraint, which corresponds to the rate function associated to a Large Deviations Principle for the PDMP. We develop a numerical method for approximating the coarse-grained model parameters, and show its accuracy for a toggle-switch network. We deduce from the reduced model an analytical approximation of the stationary distribution of the PDMP system, which appears as a Beta mixture.


Limite en graphon des cographes aléatoires.

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 17 juin 2021 09:15-10:15 Lieu : Oratrice ou orateur : Mathilde Bouvel Résumé :

Étant donnée une famille de graphes, une question naturelle (qui constitue un pan de la littérature en graphes aléatoires) est de décrire la forme limite d’un graphe pris uniformément au hasard dans cette famille. On étudiera cette question pour la famille des cographes, et on décrira leur limite (appelée le « cographon Brownien ») dans le formalisme des graphons.
Dans l’exposé, je ne supposerai aucune connaissance préalable des cographes ni des graphons. J’en présenterai d’abord les définitions et quelques propriétés clés, notamment le codage des cographes par des « cotrees ». Je décrirai les étapes principales de la preuve de la limite en graphon dans le cas des cographes étiquetés. Cette preuve utilise surtout de la combinatoire analytique sur les « cotrees » (un des exemples présentés en séance 1).
Si le temps le permet, je mentionnerai plusieurs résultats associés, notamment la limite en graphon des cographes non-étiquetés, et des résultats parallèles dans le monde des permutations qui suggèrent une universalité du cographon Brownien.

Travail en commun avec F. Bassino, V. Feray, L. Gerin, M. Maazoun, A. Pierrot.


High order heat-type equations and random walks on the complex plane

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 17 juin 2021 10:45-11:45 Lieu : Teams Oratrice ou orateur : Sonia Mazzucchi (Università di Trento, Italie) Résumé :

Télécharger le résumé (pdf)


Minimax optimality, testing, differential privacy

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 30 septembre 2021 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Joseph Lam (IECL, Nancy) Résumé :

This presentation is a summary of my PhD work. I focus on the topic of hypothesis testing, extensively studied in statistics and theoretical computer science.

I start with presenting the classical identity testing problem, in which an independent sample set X ~ q is given and one would like to determine whether q=p for some fixed known p. This problem is very related to that of estimating a distribution from a given sample set. The study of testing is relevant, because for the same fixed sample size, it is possible to test against a distribution up to a smaller separation distance than what is possible in estimation. This will give me the opportunity to describe the minimax framework which proves the theoretical optimality of statistical methods in the worst case.

I will refine the study of minimax identity testing by adding a local differential privacy condition and the interest will be in the quantitative effect of ensuring privacy. The presentation will largely be on the topic of privacy, because it bears similarities with ensuring fairness conditions.

We will also shortly consider the neighboring problem of closeness testing, where the goal remains to determine whether p=q, but only an independent sample set Y ~ p is given instead of p directly. In this context, we will go beyond a simple worst-case analysis and develop instance optimal results instead. This will highlight the interplay between one-sample testing and two-sample testing, the latter being a harder problem.


Diffusions arising from the ordered Chinese Restaurant Process

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 7 octobre 2021 10:45-11:45 Lieu : Salle Döblin Oratrice ou orateur : Kelvin Rivera-Lopez (IECL, Nancy) Résumé :

In a recent paper, Leonid Petrov showed that the up-down chains associated to the Chinese Restaurant Process (CRP) have a scaling limit – namely, a two-parameter family of diffusions that extend the one-parameter infinitely-many-neutral-alleles diffusions of Ethier and Kurtz. There has since been considerable interest in constructing ordered analogues of Petrov’s diffusions, and it is conjectured that an ordered analogue of the up-down chains will give rise to such an object. In this talk, I’ll discuss my resolution of this conjecture (joint with Douglas Rizzolo). Our approach is mainly inspired by Petrov’s work, and involves using quasisymmetric functions to describe the transition operators.


Julia pour les mathématiques: une introduction

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 14 octobre 2021 09:30-10:30 Lieu : Oratrice ou orateur : Olivier Garet Résumé :

Julia est un nouveau langage de programmation pour le calcul scientifique et les mathématiques. Son développement a commencé en 2009, dans le laboratoire Lincoln du MIT.

On retrouve dans ce langage de haut niveau les facilités classiques des langages couramment utilisés en calcul scientifique, avec en plus une rapidité d’exécution comparable
au C, tirant partie de la technologie de compilation Just In Time. Ainsi, le langage permet d’avoir un temps d’écriture rapide tout en préservant la vitesse d’exécution.

Depuis son lancement public en 2012, le langage Julia a rassemblé une large communauté. La sortie de la version 1.0 en août 2018 marque la maturité du langage, qui bénéficie aujourd’hui d’un écosystème complet: large collection de bibliothèques en ligne, environnement intégré de qualité, débogueur et profileur.

Le but de cet exposé est de présenter les fondements du langage ainsi que quelques exemples dans des domaines divers des mathématiques, avec une présentation succincte de quelques bibliothèques utiles.

L’exposé sera délibérément très généraliste, car je suis convaincu que les qualités du langage (syntaxe naturelle, rapidité d’exécution, création simple d’objets mathématiques,sans être un pro de la POO), en font un excellent candidat pour être le couteau suisse du mathématicien.


Analyse et interprétation climatologique de l'évolution des températures moyennes mondiales depuis 1880

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 14 octobre 2021 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Eric Zeltz Résumé :

Je montre comment à partir d’une étude approfondie statistique et probabiliste d’une base de données de températures moyennes mondiales, j’ai découvert des comportements climatologiques sans doute très difficilement accessibles par les techniques usuelles utilisées en climatologie.


CFTP pour les automates cellulaires probabilistes uni-dimensionnels exponentiellement ergodiques

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 21 octobre 2021 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Jean Bérard (Université de Strasbourg) Résumé :

Dans cet exposé, on construit, pour tout automate cellulaire probabiliste uni-dimensionnel exponentiellement ergodique et possédant une propriété de taux positifs, un flot CFTP (« coupling from the past ») localement défini. Plusieurs conséquences de cette construction sont discutées. (Travail exposé dans l’article arXiv:2106.07219).


On probabilistic generalizations of the Nyman-Beurling criterion for the Zeta function

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 18 novembre 2021 10:45-11:45 Lieu : Salle Döblin Oratrice ou orateur : Sébastien Darses (Aix-Marseille Université) Résumé :

One of the seemingly innocent reformulations of the terrifying Riemann Hypothesis (RH) is the Nyman-Beurling criterion: The indicator function of (0,1) can be linearly approximated in a L^2 space by dilations of the fractional part function. Randomizing these dilations generates new structures and criteria for RH, regularizing very intricate ones. One other possible nice feature is to consider polynomials instead of Dirichlet polynomials for the approximations. How then are the huge difficulties reallocated? The answers are quite surprising!

The talk will be very accessible, especially for graduate students.
Joint work with F. Alouges and E. Hillion.


Nouille infinie et systèmes méandriques

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 25 novembre 2021 09:15-10:15 Lieu : Oratrice ou orateur : Valentin Feray Résumé :

Je présenterai un modèle de percolation en une dimension introduit par Curien, Kozma, Sidoravicius et Tournier en 2017, la « nouille infinie ». Bien que le modèle soit unidimensionnel et très simple à définir (en utilisant des appariements non croises), la question de l’existence d’une composante infinie est ouverte. Je définirai ce modèle, expliquerai ce qui est connu et conjecturé, puis comment, lors d’un travail en cours avec Paul Thévenin (Uppsala), on est arrivés à regarder la taille de la composante de 0 dans ce modèle de percolation pour répondre à une question de Goulden, Nica et Puder sur le nombre de composantes d’un système méandrique.


On the rate of estimation for the stationary distribution of stochastic differential equations with and without jumps

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 25 novembre 2021 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Chiara Amorino (Université du Luxembourg) Résumé :

In this talk, we will discuss some results on the estimation of the invariant density associated to a multivariate diffusion X = (Xt)t≥0, assuming that a continuous record of observations (Xt)0≤t≤T is available. We will see that, when X = (Xt)t≥0 is the solution of a stochastic differential equation with Levy-type jumps, it is possible to find the parametric convergence rate 1/T in the monodimensional case and log(T)/T when the dimension d is equal to 2. For d ≥ 3 we find the convergence rate (log(T)/T)γ, where γ is an explicit exponent depending on the dimension d and on β3, the harmonic mean of the smoothness of the invariant density over the d directions after having removed β1 and β2, which are the smallest. Moreover, we obtain a lower bound on the L2-risk for pointwise estimation, with the rate (1/T)γ. In order to fill the logarithmic gap we consider then X = (Xt)t≥0 as a solution to a continuous stochastic differential equation. One (surprising) finding is that the convergence rate depends on the fact that β2 < β3 or β2 = β3. In particular, we show that kernel density estimators achieve the rate (log(T)/T)γ in the first case and (1/T)γ in the second. Finally, we prove a minimax lower bound on the L2-risk for the pointwise estimation with the same rates (log(T)/T)γ or (1/T)γ, depending on the value of β2 and β3.


Pattern extraction from point-cloud datasets and cosmological applications

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 2 décembre 2021 10:00-11:00 Lieu : Salle Döblin Oratrice ou orateur : Tony Bonnaire (Université Paris-Saclay) Résumé :

Point-cloud datasets are ubiquitous in many science and non-science fields. These data are usually coming along with unique patterns that some algorithms are meant to extract and that are linked with the underlying phenomenon that generated the data.
In this presentation, motivated by cosmological problematics, we will focus on two kinds of spatially structured datasets. First, clustered-type patterns in which the datapoints are separated in the input space into multiple groups. We will show that the unsupervised clustering procedure performed with a Gaussian Mixture Model can be formulated in terms of a statistical physics optimisation problem. This formulation enables the unsupervised extraction of many key information about the dataset itself, like the number of clusters, their size and how they are embedded in space, particularly interesting for high-dimensional input spaces where visualisation is not possible.
On the other hand, we will study spatially continuous datasets assuming as standing on an underlying 1D structure that we aim to learn. To this end, we resort to a regularisation of the Gaussian Mixture Model in which a spatial graph is used as a prior to approximate the underlying 1D structure. The overall graph is efficiently learnt by means of the Expectation-Maximisation algorithm with guaranteed convergence and comes together with the learning of the local width of the structure. We then illustrate applications of the algorithm to model and identify the filamentary pattern drawn by the galaxy distribution of the Universe in cosmological datasets.


Réunion d’équipe (permanents-es)

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 9 décembre 2021 09:15-10:15 Lieu : Oratrice ou orateur : Résumé :

Front du modèle FA1f en dimension 1 [REPORTÉ]

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 9 décembre 2021 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Aurélia Deshayes (Université Paris-Est Créteil) Résumé :

Dans cet exposé je présenterai un travail en collaboration avec Oriane Blondel et Cristina Toninelli où nous étudions le modèle FA1f en dimension 1. Il s’agit d’un système de particules en interaction (plus précisément un modèle issu de la physique statistique dit modèle cinétiquement contraint où chaque site met à jour la valeur de son spin si une certaine contrainte locale est satisfaite, ici c’est le fait d’avoir au moins un 0 dans ses voisins). Dans ce travail, nous prouvons, sous certaines conditions, une vitesse linéaire, et des fluctuations gaussiennes, pour le front (i.e. le 0 le plus à gauche lorsque l’on part d’une configuration initiale avec que des 1 à gauche de l’origine et un 0 en l’origine). Ce talk sera l’occasion de présenter les techniques classiques utilisées dans les modèles de croissance aléatoire tels que le processus de contact et de parler de méthode de couplage permettant de passer d’un modèle bien connu a un modèle plus complexe (en particulier non attractif).


Pathwise regularization of the stochastic heat equation with multiplicative noise through irregular perturbation

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 16 décembre 2021 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Rémi Catellier (Université Côte d'Azur) Résumé :

Existence and uniqueness of solutions to the stochastic heat equation with multiplicative spatial noise is studied. In the spirit of pathwise regularization by noise, we show that a perturbation by a sufficiently irregular continuous path establish wellposedness of such equations, even when the drift and diffusion coefficients are given as generalized functions or distributions. In addition we prove regularity of the averaged field associated to a Lévy fractional stable motion, and use this as an example of a perturbation regularizing the multiplicative stochastic heat equation.

Joint work With Fabian Harang