Limite locale des animaux dirigés dans le quart de plan
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 11 janvier 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Arvind Singh Résumé :On appelle « animal dirigé » un sous-ensemble fini du quart de plan N x N qui contient l’origine et tel que tout autre site possède au moins un voisin à sa gauche ou en dessous de lui. Dans cet exposé, je regarderai la limite quand n tend vers l’infini d’un animal choisi uniformément parmi les animaux à n sommets. Je montrerai en particulier que l’objet limite est encodé par une marche aléatoire et peut aussi s’interpréter comme un système de particules en interaction possédant une remarquable propriété de Markov spatiale (travail en collaboration avec O. Hénard et E. Maurel-Segala).
TCL quantitatifs pour réseaux neuronaux profonds
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 11 janvier 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Ivan Nourdin (Université du Luxembourg) Résumé :Dans cet exposé, nous étudierons le comportement asymptotique des réseaux neuronaux entièrement connectés avec poids et biais gaussiens et dont la taille des couches cachées tend vers l’infini. Basé sur un travail commun récent avec S. Favaro, B. Hanin, D. Marinucci et G. Peccati.
Réunion d'équipe
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 18 janvier 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Pascal Moyal Résumé :Le créneau du GDT est reservé pour une réunion d’équipe.
Cycles éco-évolutifs dans des communautés proies-prédateurs
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 18 janvier 2024 10:45-11:45 Lieu : Salle Döblin Oratrice ou orateur : Manon Costa (Université Paul Sabatier) Résumé :Dans cet exposé, nous présentons et étudions un modèle pour deux populations avec une interaction prédateur-proie, où chaque population est composée de deux types d’individus, notés 0 et 1, de sorte que les prédateurs d’un type donné prospèrent en présence de proies similaires, tandis que les proies d’un type donné ont plus de chances de survivre en présence de prédateurs du type différent.
Nous considérons une limite dans une grande population avec des mutations dans à une échelle intermédiaire, c’est à dire que le taux de mutation individuel disparaît tandis que le taux de mutation total tend vers l’infini. Nous prouvons qu’en fonction des paramètres du modèle, différents scénarios peuvent se produire : invasion successive de proies et de prédateurs conduisant à la coexistence de quatre types, ou invasion successive de proies dans une population de prédateurs résidents conduisant soit à l’extinction des proies, soit à la coexistence de tous les types, …
Formule d'Euler-Maclaurin et intégrales itérées généralisées
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 25 janvier 2024 10:45-11:45 Lieu : Oratrice ou orateur : Carlo Bellingeri Résumé :Considérée comme l’une des identités clés de l’analyse classique, la formule d’Euler-McLaurin est l’un des outils standard pour relier les sommes et les intégrales, avec des applications remarquables dans de nombreux domaines des mathématiques, bien que peu utilisée en analyse stochastique. Dans cet exposé, nous montrerons comment, en introduisant de nouvelles variantes des intégrales itérées d’un chemin et un simple problème variationnel, nous pouvons généraliser cette identité dans le contexte de l’intégration de Riemann Stieltjes.
(Le séminaire aura lieu en amphi 3.)
Moyenne et Composantes Principales de séries temporelles, une nouvelle approche avec la méthode de la signature
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 1 février 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Raphael Mignot (IECL) Résumé :English version below: upon request the presentation can be in english, please let the speaker know a.s.a.p..
L’objectif de notre travail est double : établir un barycentre de séries temporelles multidimensionnelles et trouver des directions d’importance. Nous encodons les séries temporelles avec des intégrales de différents ordres de moments, constituant leur signature.
Tout d’abord, nous avons développé une approche pour calculer la moyenne des coefficients de signature. L’espace des coefficients de signature est une variété avec une structure de groupe mais sans métrique riemannienne bi-invariante, ce qui rend difficile l’utilisation d’approches Riemanniennes classiques.
Ensuite, dans le même esprit que la procédure de calcul de la moyenne, nous cherchons les géodésiques importantes. Importantes dans le sens où les coefficients de signature ont une variance maximale le long de ces géodésiques. Elles décrivent donc bien les données dans l’espace des coefficients de signature. Ces directions principales peuvent être utilisées pour une interprétation qualitative des données, mais aussi pour la réduction de dimension, comme on le fait avec l’analyse en composantes principales lorsqu’on analyse des données dans un espace Euclidien.
Title: Mean and Principal Components of time series, a new approach with the signature method.
Abstract: The aim of our work is twofold: average multidimensional time series and find directions of importance. We encode time series with integrals of various moment orders, constituting their signature.
First, we have developed an approach to average signatures coefficients. The space of signature coefficients is a manifold with a group structure but without a bi-invariant Riemannian metric, making it difficult to use classic Riemannian approaches.
Then, in the same spirit as in the averaging procedure, we look for important geodesics. Important in the sense that the signature coefficients have maximum variance along those. Thus, they describe well the data in the space of signature coefficients. Those main directions could be used for a qualitative interpretation of the data but also for dimension reduction, as it is done with the Principal Component Analysis when analyzing data in a Euclidean space.
Maxima of a random model of the Riemann zeta function on longer intervals (and branching random walks)
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 1 février 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Lisa Hartung Résumé :(Séminaire commun avec l’équipe ATN.)
Normalité asymptotique sous dépendance locale, et application aux occurrences de motifs dans les permutations aléatoires
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 8 février 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Dubach Victor Résumé :Mouvement brownien réfléchi dans un cône : étude du cas transient
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 8 février 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Sandro Franceschi Résumé :La littérature consacrée au mouvement brownien réfléchi dans un cône bidimensionnel est la plupart du temps consacrée à l’étude de sa distribution stationnaire dans le cas récurrent. Dans cet exposé, nous intéresserons en revanche au cas transient pour étudier les fonctions de Green de ce processus et leurs asymptotiques. Ceci nous amènera à considérer la frontière de Martin associée et les fonctions harmoniques satisfaisant des conditions de Neumann obliques sur les bords du cône. Pour certains modèles, nous illustrerons cela en étudiant la probabilité d’évasion du processus le long d’un axe et sa probabilité d’absorption au sommet du cône.
Pour établir nos résultats, nous utilisons des méthodes analytiques historiquement développées pour étudier les marches aléatoires dans le quadrant. Nous établissons des équations fonctionnelles satisfaites par les transformées de Laplace des fonctions de Green. Grâce à la théorie des problèmes frontières (de Riemann et Carleman), il est possible de déterminer des formules explicites pour ces transformées de Laplace impliquant des fonctions hypergéométriques. La méthode du point col et des lemmes de transfert taubériens permettent d’obtenir des résultats asymptotiques et d’établir la frontière de Martin.
Moyenne et Composantes Principales de séries temporelles, une nouvelle approche avec la méthode de la signature II
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 15 février 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Raphael Mignot (IECL) Résumé :Suite du groupe de travail du 1er février. Le résumé est actualisé.
L’objectif de notre travail est double : établir un barycentre de séries temporelles multidimensionnelles et trouver des directions d’importance. Nous encodons les séries temporelles avec des intégrales de différents ordres de moments, constituant leur signature.
Dans un premier groupe de travail (1er fév.), nous avons introduit la topologie de l’espace des signatures et de leur espace ambiant, ainsi que leurs propriétés fondamentales. L’espace des coefficients de signature est une variété avec une structure de groupe mais sans métrique riemannienne bi-invariante, ce qui rend difficile l’utilisation d’approches Riemanniennes classiques.
Dans cet épisode 2, nous reviendrons sur les barycentres de signatures puis nous introduirons une généralisation de l’Analyse en Composantes Principales aux variétés différentiables. Dans le même esprit que la procédure de calcul de la moyenne, nous cherchons les géodésiques importantes. Importantes dans le sens où les coefficients de signature ont une variance maximale le long de ces géodésiques. Elles décrivent donc bien les données dans l’espace des coefficients de signature. Ces directions principales peuvent être utilisées pour une interprétation qualitative des données, mais aussi pour la réduction de dimension, comme on le fait avec l’analyse en composantes principales lorsqu’on analyse des données dans un espace Euclidien.
Gaussian random fields on Riemannian manifolds: Applications to Geostatistics
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 15 février 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Mike Pereira (Université Paris Sciences & Lettres) Résumé :Many applications in spatial and spatio-temporal statistics require data to be modeled by Gaussian processes on non-Euclidean domains, or with non-stationary properties. Using such models generally comes at the price of a drastic increase in operational costs (computational and storage-wise), rendering them hard to apply to large datasets. In this talk, we propose a solution to this problem, which relies on the definition of a class of random fields on Riemannian manifolds. These fields extend ongoing work that has been done to leverage a characterization of the random fields classically used in Geostatistics as solutions of stochastic partial differential equations. The discretization of these generalized random fields, undertaken using a finite element approach, then provides an explicit characterization that is leveraged to solve the scalability problem. Indeed, matrix-free algorithms, in the sense that they do not require to build and store any covariance (or precision) matrix, are derived to tackle for instance the simulation of large Gaussian fields with given covariance properties, even in the non-stationary setting or on surfaces.
Comportement en temps long des équations de Cucker-Smale et inférence de structure sociale
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 22 février 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Adrien Cotil Résumé :La compréhension de l’auto-organisation d’un système, c’est-à-dire sa capacité à faire émerger des comportements collectifs sans intervention extérieure, est à la base du développement de nombreux domaines scientifiques, aussi bien en physique, en informatique, en mathématiques, en biologie ou en sociologie. Au sein de ce domaine se trouve l’étude des modèles de consensus, permettant de décrire comment des agents s’échangent de l’information afin d’aboutir à une décision commune. Dans cet exposé, nous aborderons un modèle de consensus largement étudié dans la littérature : le modèle de Cucker-Smale. Ce dernier décrit des individus qui se déplacent dans l’espace et qui s’alignent les uns sur les autres. Il suppose que la force avec laquelle les individus s’alignent entre eux dépend à la fois de la distance qui les sépare et d’un paramètres A(i,j) qui décrit intrinsèquement comment un individu i s’aligne sur un individu j. L’une des questions principales est la détermination de conditions qui assurent que les individus tendent tous à se déplacer dans la même direction à la même vitesse, appelé phénomène de flocking dans ce contexte. En exploitant la dualité entre les équations de Cucker-Smale et les équations de Kolomogorov, nous prouvons que le flocking est équivalent à la convergence en variation total d’un certain processus de saut markovien inhomogène en temps. Nous prouvons ensuite cette convergence en utilisant des techniques de type Doeblin, permettant de dériver de nouvelles conditions de flocking plus fines que celles connues pour ce modèle. Enfin, nous traiterons la question de l’apprentissage du paramètre A(i,j) à partir de données de déplacement d’animaux, permettant d’obtenir des informations sur la manière dont ceux-ci se comportent socialement les uns avec les autres.
Systems of FBSDEs driven by Brownian Motion and Numerical Simulation of Fluid Dynamics
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 14 mars 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Hernán A. Mardones González (Universidad de la Frontera, Chile) Résumé :The systems of forward-backward stochastic differential equations driven by Brownian motion (FBSDEs for short) help us to model diffusion processes related to phenomena that involve environment perturbations. The drift coefficients constitute the descriptive part of a non-random ambient, while the Wiener processes permit us to describe the random perturbations involved into the dynamics through the diffusion terms. The systems of FBSDEs motion are linked to the nonlinear partial differential equations (PDEs) through the Feyman-Kac formulae. Therefore, the deterministic solutions can be obtained by probabilistic representations involving the stochastic processes that solve the FBSDEs.
During this talk, we deal with the numerical simulation of systems of stochastic particles ruled by FBSDEs associated with nonlinear PDEs appearing in fluid dynamics. To make this, we discretize locally in time the stochastic equations, and then we consider integration schemes of Euler-Maruyama type, together with the optimal quantization of the involved Wiener increments as an alternative to the Monte-Carlo simulation. Then we approximate the related conditional expectations over each temporal-spatial node of a computational domain with uniform discretization steps in time and space. Numerical results are presented to the case of analytic spatially-periodic exact solutions of the incompressible Navier-Stokes equations, in particular, a two-dimensional Taylor-Green vortex and three-dimensional Beltrami flows, for example an Arnold-Beltrami-Childress flow. The simulation algorithms follow from a completely probabilistic approach.
A construction of cylindrical distribution based on the normal distribution and its regression modeling
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 14 mars 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Toshihiro Abe (Hosei University) Résumé :Cylindrical distributions are joint distributions of a circular variable and a linear variable, where the circular variable affects the linear variable. In this paper, we consider a class of cylindrical distributions based on the normal distribution, which have normal and angular conditional and marginal distributions. The distribution based on the normal distribution has the advantages of easy random number generation and simple Fisher information matrix. We also consider a regression model using the cylindrical distribution. Examples of estimation will be given for real data, and a new methodology of data analysis using the cylinder model will be given. Furthermore, we also discuss some potential extensions of the cylindrical distribution.
Introduction aux EDPS singulières et aux Structures de Régularité(I)
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 21 mars 2024 09:15-10:30 Lieu : Salle de conférences Nancy Oratrice ou orateur : Yvain Bruned Résumé :Exposants critiques pour le champ libre gaussien sur le système de câbles en dimensions intermédiaires.
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 21 mars 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Alexis Prevost (Université de Genève) Résumé :La transition de phase associée à un modèle de percolation peut être quantifiée à l’aide d’un certain nombre de constantes, appelées exposants critiques, qui décrivent la vitesse à laquelle certaines quantités décroissent au voisinage du point critique. J’expliquerai comment calculer certains de ces exposants critiques quand le modèle de percolation est le champ libre gaussien sur le système de câbles en dimension trois ou quatre.
Maximum de vraisemblance composite pour un champ aléatoire de Brown-Resnick en infill
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 28 mars 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Nicolas Chenavier (Université du Littoral Côte d'Opale) Résumé :Dans cet exposé, on s’intéresse à un certain type de champ aléatoire: le champ de Brown-Resnick. La loi de ce dernier est décrite par deux paramètres: l’un d’échelle, l’autre de Hurst. On suppose que le champ est observé dans une fenêtre fixée en un nombre fini de sites. Les sites sont donnés par la réalisation d’un processus ponctuel de Poisson. Estimer les paramètres par maximum de vraisemblance est en pratique impossible car les lois fini-dimensionnelles ne peuvent être calculées de façon efficace. Pour y remédier, nous considérons les estimateurs par maximum de vraisemblance composite en retenant comme pairs les pairs de points qui sont voisins dans la triangulation de Delaunay sous-jacent et comme triplets les triplets qui sont sommets d’un triangle de Delaunay. Les résultats sont des théorèmes limites sur ces estimateurs, lorsque l’intensité du processus de Poison tend vers l’infini. Travail joint avec Christian Y. Robert.
Introduction aux EDPS singulières et aux Structures de Régularité(II)
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 4 avril 2024 09:15-10:30 Lieu : Salle Döblin Oratrice ou orateur : Yvain Bruned Résumé :Improved linear regression prediction by transfer learning
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 4 avril 2024 10:45-11:45 Lieu : Salle Döblin Oratrice ou orateur : Jairo Cugliari (Université Lyon 2) Résumé :L’apprentissage par transfert (transfert learning) vise à réutiliser les connaissances d’un ensemble de données source vers un ensemble de données cible similaire. Alors que plusieurs études abordent le problème de quoi ou comment transférer, la question très importante de quand le faire reste principalement sans réponse, surtout d’un point de vue théorique pour les problèmes de régression.
Dans l’exposé je présenterai le cadre général de l’apprentissage par transfert. Puis, je détaillerai un nouveau cadre théorique pour le problème du transfert de paramètres pour le modèle linéaire… Il est démontré que la qualité du transfert pour un nouveau vecteur d’entrée dépend de sa représentation dans une base propre impliquant les paramètres du problème. De plus, un test statistique est construit pour prédire si un modèle affiné (fine tuned) a un risque quadratique de prédiction inférieur au modèle cible de base pour un échantillon non observé. L’efficacité du test est illustrée sur des données synthétiques ainsi que des données réelles de consommation d’électricité.
David Obst, Badih Ghattas, Sandra Claudel, Jairo Cugliari, Yannig Goude, Georges Oppenheim,
Improved linear regression prediction by transfer learning, CSDA (2022)
Semi-LASSO: un weighted LASSO pour l'intégration de régresseurs connus dans un modèle linéaire
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 11 avril 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Anouk Rago (IECL) Résumé :Le LASSO est une technique très largement utilisée lorsqu’il s’agit à la fois d’estimer les paramètres d’un modèle et d’effectuer une sélection de variables. Il est particulièrement utile pour étudier de grands jeux de données, comme cela peut être le cas en biologie des systèmes par exemple, ce qui le rend très utilisé dans le domaine de l’inférence de réseaux de gènes. Cette méthode peut par ailleurs être enrichie et améliorée par des connaissances préalables sur les régresseurs potentiels, afin de guider la sélection de variables. Dans ce cas, on peut employer un weighted LASSO, dérivé du LASSO original, dans lequel l’ajout de poids spécifiques à chaque variable permet d’encoder des a priori. Le package R `glmnet’ permet à l’utilisateur de spécifier ses propres poids via un paramètre. Nous introduisons ici une nouvelle méthode appelée semi-LASSO qui résout un cas spécifique de weighted LASSO. Son implémentation repose sur l’utilisation du package `glmnet’, mais inclut une première étape de réduction de dimension pour une meilleure optimisation de la fonction de coût du LASSO. Des simulations numériques sont effectuées sur des données synthétiques afin de comparer les résultats obtenus avec le weighted LASSO de `glmnet’ et notre méthode semi-LASSO.
On nonparametric estimation of the interaction function in particle system models
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 11 avril 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Mark Podolskij Résumé :This paper delves into a challenging problem of nonparametric estimation for the interaction function within diffusion-type particle system models. We introduce two estimation methods based upon an empirical risk minimization. Our study encompasses an analysis of the stochastic and approximation errors associated with both procedures, along with an examination of certain minimax lower bounds. In particular, for the first method we show that there is a natural metric under which the corresponding estimation error of the interaction function converges to zero with parametric rate which is minimax optimal. This result is rather surprising given the complexity of the underlying estimation problem and rather large class of interaction functions for which the above parametric rate holds.
Introduction aux EDPS singulières et aux Structures de Régularité(III)
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 18 avril 2024 09:15-10:30 Lieu : Salle de conférences Nancy Oratrice ou orateur : Yvain Bruned Résumé :Limite d'échelle pour la limite locale de l'arbre couvrant minimal du graphe complet
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 18 avril 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Delphin Sénizergues Résumé :Pour un graphe connexe donné muni de poids distincts sur les arêtes, il existe un unique arbre couvrant dont la somme des poids des arêtes est minimale: on l’appelle l’arbre couvrant minimal. On s’intéresse aux propriétés asymptotiques, pour n grand, de l’arbre couvrant minimal défini à partir du graphe complet à n sommets muni de poids i.i.d. sur les arêtes.
Un résultat de convergence locale nous décrit la structure de cet objet autour d’un point typique à l’aide d’un arbre discret infini. Dans un travail avec Omer Angel, nous montrons que cet arbre infini admet une limite d’échelle: lorsqu’on fait tendre les longueurs des arêtes de cet arbre vers 0, on voit apparaître un arbre continu, dont on peut donner une construction explicite.
Je présenterai les objets mentionnés et expliquerai les grandes lignes de la preuve de la convergence du discret vers le continu.
Modélisation de la dégradation de batteries électriques avec quantification des incertitudes
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 6 mai 2024 14:00-15:30 Lieu : Salle Döblin Oratrice ou orateur : Benjamin Larvaron (IECL/TotalEnergies) Résumé :Groupe de travail extraordinaire: preparation à la soutenance.
Les batteries Lithium-ion représentent actuellement un enjeu majeur pour l’industrie. Elles sont appelées à être utilisées massivement avec le développement des voitures électriques, ainsi pour le stockage d’énergie d’origine renouvelable, par nature intermittente et décentralisée. Au vu de ces enjeux de nombreux nouveaux modèles de batteries sont développés. Chacun vise à améliorer les performances précédentes et en particulier en ce qui concerne la durée de vie et la vitesse de dégradation. Ici, nous nous intéresserons à la modélisation statistique de cette dégradation, apprise à partir de mesures expérimentales du vieillissement. Pour que son utilisation soit fiable en pratique, cette modélisation doit être accompagnée d’une quantification des différentes sources d’incertitudes.
Dans un premier temps nous présenterons la modélisation de la dégradation à une condition expérimentale de référence. Pour ce faire nous utiliserons des méthodes centrées sur l’utilisation des processus gaussiens. Ces méthodes ont l’avantage de permettre l’apprentissage de fonctions complexes, tout en permettant une quantification des incertitudes de part leur nature probabiliste. Partant de l’état de l’art avec la régression par processus gaussien, nous verrons les limites de cette approche pour quantifier l’évolution temporelle des incertitudes et extrapoler les cycles futurs. En réponse, nous proposerons l’utilisation du cadre plus général de la régression par processus gaussiens chaînés complétée par l’intégration de contraintes sur les dérivés.
Dans un second temps, nous élargirons le problème au cas de plusieurs conditions expérimentales, avec l’objectif de prédire la dégradation à des conditions expérimentales non observées. Face aux difficultés rencontrées pour modéliser l’effet des conditions avec les méthodes par processus gaussiens, nous proposons une autre approche reposant sur la théorie du transport optimal. Nous introduirons l’idée d’un barycentre conditionnel de Wassertein comme de méthode de régression lorsque les sorties sont des distributions de probabilités. La régression Fréchet, un type particulier de barycentre conditionnel, sera utilisée pour modéliser l’effet de la température sur le vieillissement des batteries.
Possible réunion d'équipe
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 16 mai 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Pascal Moyal Résumé :Le créneau du GDT est reservé pour une eventuelle réunion d’équipe, si elle n’a pas lieu avant.
Quelques limites d'échelle pour le processus d'exclusion facilité en 1d
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 16 mai 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Marielle Simon (Université Lyon 1) Résumé :Le but de cet exposé est de présenter quelques résultats récents pour le processus d’exclusion facilité en une dimension.
Ce modèle de gaz sur réseau stochastique est soumis à de fortes contraintes cinétiques qui créent une transition de phase continue vers un état absorbant à une valeur critique de la densité des particules. Si la dynamique microscopique est symétrique, son comportement macroscopique (avec conditions aux limites périodiques et dans l’échelle de temps diffusive), est régi par une EDP non linéaire appartenant aux problèmes à frontières libres (ou problèmes de Stefan). L’un des ingrédients majeurs est de montrer que le système atteint la composante « ergodique » en un temps sous-diffusif. Dans le cas asymétrique, la densité empirique converge vers l’unique solution entropique d’un problème hyperbolique de Stefan. Tous ces résultats reposent, dans une certaine mesure, sur un argument de mapping avec un processus de type zero-range, qui ne peut pas être utilisé en dimension plus grande que 1.
D’après des travaux en collaboration avec O. Blondel, H. Da Cunha, C. Erignoux, M. Sasada et L. Zhao.
Graphes à décomposition modulaire prescrite, convergence au sens des graphons et nombre de sous-graphe induits
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 23 mai 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Théo Lenoir (Polytechnique) Résumé :L’objectif de cet exposé est de montrer comment se comportent certains types de modèles de graphes en particulier des modèles de graphes à motifs exclus. Pour cela nous introduirons la décomposition modulaire, un outil relativement connu en algorithmique, mais dont l’étude d’un point de vue probabiliste a commencé très récemment. Nous verrons alors comment pour une large classe de modèles définies par diverses contraintes sur la décomposition modulaire, on arrive à connaître la densité de chaque graphe comme sous-graphe induit. Ce résultat implique une convergence au sens des « graphons » qui peut être vue comme une sorte de convergence des matrices d’adjacences. On a la convergence d’un graphe de taille n vers un graphe « continu » qui est appelé cographon Brownien et peut être construit à partir d’une excursion Brownienne.
A new sampling framework for spatial surveys with application to the french national forest inventory
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 30 mai 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Trinh Duong (LIF, LabEx ARBRE) Résumé :Surveying natural populations is challenging due to their scattered distribution across a territory. To create spatially balanced samples, surveys typically divide the territory into a spatial grid and either use the grid nodes to form the sample or select points within the grid cells. Sampling the cells adds an additional stage, as currently employed by the French National Forest Inventory (NFI) for annual estimates. However, little attention has been given to accounting for this stage. Double sampling for stratification is a general method that helps reduce the size of a field sample, which is particularly costly. To improve sampling efficiency, we propose a new framework called two-stage two-phase sampling, incorporating a two-stage sampling design in the first phase.
The Horvitz-Thompson estimator is used to estimate the total value. In the first stage, cells are sampled using spatially systematic sampling, and in the second stage, points within these cells are sampled uniformly. The classification of first-phase points into strata is performed through photo-interpretation. In the second phase, points are sampled using spatially systematic sampling over the first-phase sample, based on varying sampling intensities across the strata. To calculate the variance estimator, the global first-phase sample is modeled as uniform sampling, and the global second-phase sample is modeled as stratified simple random sampling. Our results indicate that the expansion estimator remains unbiased and the variance estimators are moderately conservative for the sampling design used by the French NFI.
Additionally, the forest is undergoing rapid changes due to various disturbances, which can be large-scale, such as windthrow or fire, or small-scale, like bark beetle infestations. Our project focuses on large-scale disturbances. Estimating the area affected by such disturbances, known as the area of interest, is interesting for foresters. To address this, we are considering the intensification method, which increases sampling intensity in the area of interest. This method requires higher sampling intensity in specific zones compared to others, resulting in different sampling intensities across regions. A two-stage two-phase sampling framework is particularly useful for managing these varying sampling rates during the second phase, as disturbance information only becomes available at this phase.
Deep neural network approximations for high dimensional Kolmogorov PDEs
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 30 mai 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Diyora Salimova Résumé :Most of the numerical approximation methods for PDEs in the scientific literature suffer from the so-called curse of dimensionality (CoD) in the sense that the number of computational operations and/or the number of parameters employed in the corresponding approximation scheme grows exponentially in the PDE dimension and/or the reciprocal of the desired approximation precision. In recent years, certain deep learning-based approximation methods for PDEs have been proposed and various numerical simulations for such methods suggest that they might have the capacity to indeed overcome the CoD in the sense that the number of real parameters used to describe the approximating neural networks grows at most polynomially in both the PDE dimension and the reciprocal of the prescribed approximation accuracy. In this talk, I will show some theoretical results which state that this is indeed the case for suitable Kolmogorov PDEs.
Colloquinte et pique nique
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 20 juin 2024 09:00-14:00 Lieu : Salle Döblin Oratrice ou orateur : Equipe PS Résumé :Voici à nouveau le colloquinte, photo d’équipe et pique nique. Tenez vous libres entre 9h15 et 14h. Nous serons en salle Döblin.
Programme preliminaire:
10h00 * Pause café *
10h30 Formes limites de tableaux de Young aléatoires et discontinuités, Valentin Feray,
11h15 Processus de branchement binaire avec interactions de type Moran (BBMMI), Denis Villemonais.
12h00 * Préparation pour le pique-nique sur le mode de l’auberge espagnole *
12h15 * Photo d’équipe *
Testing normality of many samples
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 4 juillet 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Maria Dolorès Jimenez Gamero (Séville) Résumé :We study the problem of simultaneously testing that each of k independent samples come from a normal population. The means and variances of those populations may differ. The proposed procedures are based on the BHEP test and they allow k to increase, which can be even larger than the sample sizes.
Réunion d'équipe et workshop L2
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 19 septembre 2024 - 20 septembre 2024 00:00-23:59 Lieu : Salle de conférences Nancy Oratrice ou orateur : Simon Bartolacci, Victor Dubach, Tianxiao Guo, Aline Kurtzmann, Ivan Nourdin et Pierre Perruchaud Résumé :jeudi 19 septembre, 10:45 réunion de rentrée de l’équipe PS
du jeudi 19 septembre, 16:00, au vendredi 20, 11:30 : L² Workshop in Probability and Statistics à Nancy, plus d’infos
The multivariate fractional Ornstein-Uhlenbeck process
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 26 septembre 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Paolo Pigato (Roma) Résumé :Un flot de gradient sur l'espace des contrôles avec condition initiale irrégulière
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 26 septembre 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Paul Gassiat (Paris Dauphine) Résumé :On considère un problème de contrôle consistant à trouver une trajectoire reliant un point initial x à un point cible y, le système se déplaçant uniquement dans certaines directions admissibles. On suppose que les champs de vecteurs correspondants satisfont la condition de Hörmander, de telle sorte que par un théorème classique (Chow-Rashevskii), il existe des trajectoires qui satisfont cette contrainte. Une manière naturelle d’essayer de résoudre ce problème est via un flot de gradient sur l’espace des contrôles. Cependant, la dynamique correspondante peut avoir des point-selles, et pour obtenir un résultat de convergence il faut donc faire des hypothèses (par exemple probabilistes) sur la condition initiale. Dans ce travail, nous considérons le cas où cette initialisation est irrégulière, que nous formulons grâce à la théorie des trajectoires rugueuses de Lyons. Dans des cas simples, on prouve que le flot de gradient converge vers une solution, si la condition initiale est une trajectoire d’un mouvement Brownien (ou d’un processus de régularité plus faible). La preuve combine des idées de calcul de Malliavin avec des inégalités de Łojasiewicz. Une motivation possible pour nos travaux vient de l’entraînement de réseaux de neurones résiduels profonds, dans un régime où le nombre de paramètres par couche est fixé, et la dimension du vecteur de données est élevée. Il s’agit d’un travail en collaboration avec Florin Suciu (Paris Dauphine).
Réunion d'équipe
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 3 octobre 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Résumé :Couplages de processus stochastiques en géométrie sous-riemannienne
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 3 octobre 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Magalie Bénéfice (IECL) Résumé :On s’intéresse à l’étude de couplages des mouvements browniens sous-elliptiques sur plusieurs variétés sous-riemaniennes: les groupes de Carnot libres d’ordre 2, incluant le groupe d’Heisenberg, ainsi que les groupes de matrices $SU(2)$ et $SL(2,\mathbb{R})$. Après une rapide introduction aux structures sous-Riemannienne, nous proposerons plusieurs méthodes explicites de couplages markoviens ou non markoviens. En particulier ces constructions mènent à des estimées du taux de couplage dont on déduit des inégalités pour le semi-groupe de la chaleur et pour les fonctions harmoniques que nous expliciterons.
Pour finir nous présenterons un nouveau modèle de couplage non markovien « en un coup » sur tous les groupes de Carnot libres de profondeur 2. Il permet notamment d’obtenir des relations similaires à la formule de Bismut-Elworthy-Li pour les gradients de semi-groupes via l’étude d’un changement de probabilité sur l’espace des vecteurs Gaussiens.
Estimations multi-échelles pour les réseaux chimiques autocatalytiques
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 10 octobre 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Jérémie Unterberger (IECL) Résumé :Je présenterai un travail au long cours, en collaboration avec des collègues de l’ESPCI (Ecole supérieure de physique et chimie industrielle), concernant l’étude des réseaux chimiques complexes, qui est notamment motivé par des thématiques biologiques autour des origines de la vie. Je montrerai en particulier comment le problème peut se ramener à l’étude de perturbations de générateurs de chaînes de Markov en temps continu présentant de nombreuses échelles de temps, et introduirai une méthode multi-échelles permettant d’estimer l’exposant de Lyapunov (plus grande valeur propre) et le vecteur propre associé.
Deux seances consecutives: 10 et 17 octobre
On the nonconvexity of push-forward constraints and its consequences in machine learning
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 10 octobre 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Lucas De Lara (IECL) Résumé :The push-forward operation enables one to redistribute a probability measure through a deterministic map. It plays a key role in statistics and optimization: many learning problems (notably from optimal transport, generative modeling, and algorithmic fairness) include constraints or penalties framed as push-forward conditions on the model. However, the literature lacks general theoretical insights on the (non)convexity of such constraints and its consequences on the associated learning problems. The presented work aims at filling this gap. In a first part, we provide a range of sufficient and necessary conditions for the (non)convexity of two sets of functions: the maps transporting one probability measure to another; the maps inducing equal output distributions across distinct probability measures. This highlights that for most probability measures, these push-forward constraints are not convex. In a second time, we show how this result implies critical limitations on the design of convex optimization problems for learning generative models or group-fair predictors. This work will hopefully help researchers and practitioners have a better understanding of the critical impact of push-forward conditions onto convexity.
Estimations multi-échelles pour les réseaux chimiques autocatalytiques
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 17 octobre 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Jérémie Unterberger (IECL) Résumé :Je présenterai un travail au long cours, en collaboration avec des collègues de l’ESPCI (Ecole supérieure de physique et chimie industrielle), concernant l’étude des réseaux chimiques complexes, qui est notamment motivé par des thématiques biologiques autour des origines de la vie. Je montrerai en particulier comment le problème peut se ramener à l’étude de perturbations de générateurs de chaînes de Markov en temps continu présentant de nombreuses échelles de temps, et introduirai une méthode multi-échelles permettant d’estimer l’exposant de Lyapunov (plus grande valeur propre) et le vecteur propre associé.
Deux seances consecutives: 10 et 17 octobre
Analysis of point patterns observer with errors
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 17 octobre 2024 10:45-11:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : Aila Särkkä (Chalmers University, Sweden) Résumé :Une chaine de Markov sur les permutations, et son temps de mélange.
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 7 novembre 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Valentin Feray Résumé :Il est bien connu qu’une chaîne de Markov finie apériodique irréductible converge vers sa distribution stationnaire. Mais à quelle vitesse ? Il s’agit là souvent d’une question difficile. Dans cet exposé je présenterai une famille de chaînes de Markov, appelées chaînes montantes-descendantes, pour lesquelles on peut calculer de manière exacte la distance (au sens de la distance de séparation) entre la chaîne de Markov et sa distribution stationnaire. Un exemple dans le monde des permutations sera présenté et étudié plus spécifiquement.
Spatio-Temporal Statistical Modelling for Environmental and Public Health Applications
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 7 novembre 2024 10:45-10:45 Lieu : Salle de conférences Nancy Oratrice ou orateur : André Victor Ribeiro Amaral (Imperial College London) Résumé :The increasing availability of temporal and geo-coded data underscores the importance of spatio-temporal statistical modelling in tackling complex issues across various real-world settings. In the first part of this talk, we will briefly showcase novel spatio-temporal statistical methods developed to model various types of data defined both in space and time (e.g., time-series, point patterns, lattice data, geostatistical data, etc.), with a focus on applications in environmental and public health domains. In the second part, we will (I) delve into the modelling of trajectory (or path) data and (II) explore the details of a statistical method for addressing spatially varying preferential sampling when modelling geostatistical data. Specifically, we will account for preferential sampling by including a spatially varying coefficient that describes the dependence strength between the process that models the sampling locations and the corresponding latent field. We achieve this by approximating the preferentiality component with a set of basis functions, with the corresponding coefficients estimated using the integrated nested Laplace approximation (INLA) method. This approach allows for efficient inference with a low computation burden.