Exposés à venir
Exposés passés
Percolation arithmétique
22 mars 2018 10:45-11:45 -Oratrice ou orateur : Sébastien Martineau
Résumé :
Si on part du réseau carré et efface chaque sommet indépendamment avec une certaine probabilité q, on effectue ce qui s’appelle une percolation de Bernoulli : cet important modèle de mécanique statistique rend compte des phénomènes d’infiltration en milieu poreux. Si on part du réseau carré mais cette fois-ci efface chaque sommet $(x,y)$ tel que $PGCD(x,y)neq 1$, on obtient maintenant un objet déterministe de nature arithmétique. Est-il possible de former une percolation (véritablement aléatoire donc) riche en informations arithmétiques ?
On va voir que cela est effectivement possible : on peut définir à quoi ressemble le sous-graphe arithmétique précédent « vu depuis un point tiré uniformément dans le plan ». Ce sous-graphe aléatoire est obtenu selon un « crible d’Ératosthène aléatoire ». On fournira de ce graphe aléatoire une définition élémentaire, puis utilisera le lemme chinois pour faire le pont entre le sous-graphe arithmétique déterministe et sa contrepartie aléatoire. On abordera ensuite brièvement quelques problèmes naturels, comme l’étude des composantes connexes infinies du graphe aléatoire.
Mean-field games with branching
22 février 2018 10:45-11:45 -Oratrice ou orateur : Xiaolu Tan
Résumé :
The mean-field game (MFG) consists in a differential game of a very large population on a finite or infinite time horizon. In this work, we study the mean-field games with branching, which allows to model the immigration, default and reproduction behaviour in the population. We show how the branching feature would change the formulation of the problem and then provide a general existence result of this new MFG. This is a joint work with Julien Claisse and Zhenjie Ren
Variational Inference in the Poisson lognormal model for multivariate analysis in ecology
15 février 2018 10:45-11:45 -Oratrice ou orateur : Julien Chiquet
Résumé :
Many application domains such as ecology or genomics have to deal with multivariate count data. A typical example is the joint observation of the respective abundances of a set of species in a series of sites, aiming to understand the co-variations between these species. The Gaussian setting provides a canonical way to model such dependencies, but does not apply in general. We adopt here the Poisson lognormal (PLN) model, which is attractive since it allows one to describe multivariate count data with a Poisson distribution as the emission law, while all the dependencies is kept in an hidden friendly multivariate Gaussian layer. While usual maximum likelihood based inference raises some issues in PLN, we show how to circumvent this issue by means of a variational algorithm for which gradient descent easily applies. We then derive several variants of our algorithm to apply PLN to PCA, LDA and sparse covariance inference on multivariate count data. We illustrate our method on microbial ecology datasets, and show the importance of accounting for covariate effects to better understand interactions between species.
Economic and financial problematic in discrete-time models with multiple and non-dominated priors
8 février 2018 10:45-11:45 -Oratrice ou orateur : Laurence Carassus
Résumé :
We will present some financial and economic problematics arising in discrete-time financial/economic models with a finite time horizon under non-dominated model uncertainty. This means that there exists a set of probability measures representing the agent beliefs and that this set is not dominated by a reference measure.
The technics are based on dynamic programming and measurable selection. We also use analytic sets which display the nice property of being stable by projection or countable unions and intersections but fail to be stable by complementation.
Sur la contrainte des solutions d'équations différentielles dirigées par le mouvement brownien fractionnaire.
1 février 2018 10:45-11:45 -Oratrice ou orateur : Nicolas Marie
Résumé :
Dans le contexte du calcul d’Itô, il existe plusieurs façons de contraindre la solution d’une équations différentielle dirigée par le mouvement brownien à rester dans un convexe fermé de l’espace : problème de réflexion de Skorokhod, condition d’invariance, singularités du champs de vecteurs avec force de rappel etc. Le but de cet exposé est de présenter des extensions de ces méthodes aux équations différentielles dirigées par le mouvement brownien fractionnaire, dans le contexte de la théorie des trajectoires rugueuses.
Reconstruction probabiliste de généalogies dans les populations végétales polyploïdes
25 janvier 2018 10:45-11:45 -Oratrice ou orateur : Frédéric Proia
Résumé :
On proposera dans cet exposé une approche probabiliste de reconstruction de généalogies dans les populations végétales polyploïdes (o๠les chromosomes ne vont pas nécessairement par paires). On présentera dans un premier temps une reconstruction dans une population de genêts diploïdes pour lesquels on dispose de la présence/absence de certains allèles spécifiques : la loi de probabilité du modèle s’appuie sur l’équilibre de Hardy-Weinberg. Dans un second temps, on généralisera cela à une population de rosiers polyploïdes, dont le niveau de ploïdie varie de 2x à 6x (avec une majorité de 4x). Dans un tel modèle, les lois de reproduction sont soumises à des règles combinatoires et à la problématique du dosage allélique (par exemple un hétérozygote 4x peut donner lieu à de nombreux génotypes : ‘aaab’, ‘aabb’, ‘abbb’, ‘aabc’, ‘abbc’, …, ‘abcd’). Notre modèle tient compte de ces phénomènes et propose une arborescence probabilisée des liens génétiques potentiels dans la population.
(Optimal) Best Arm Identification and application to Monte-Carlo Tree Search
18 janvier 2018 10:45-11:45 -Oratrice ou orateur : Emilie Kaufmann
Résumé :
In Monte-Carlo Tree Search (MCTS), the goal is to adaptively
explore paths in a game tree and perform random leaves evaluation, in
order to quickly discover the best action to take at the root. In this
talk, I will introduce a simple model for MCTS, that can be viewed as a
structured best arm identification problem in a multi-armed bandit
model. After a review of recent advances to tackle the standard best arm
identification (BAI) problem, I will explain how any BAI algorithm can
be converted to a MCTS algorithm. I will then present empirical results
and sample complexity guarantees for two particular algorithms,
UGapE-MCTS and LUCB-MCTS.
This is joint work with Aurélien Garivier (Université de Toulouse) and
Wouter Koolen (CWI, Amsterdam)
Algorithmes stochastiques pour la statistique robuste en grande dimension
11 janvier 2018 10:45-11:45 -Oratrice ou orateur : Antoine Godichon
Résumé :
La médiane géométrique est souvent utilisée en statistique du fait de sa robustesse. On s’intéresse donc à des estimateurs rapides de la médiane, qui consistent en des algorithmes de gradient stochastiques moyennés. On définit aussi un nouvel indicateur de dispersion robuste, appelé Matrice de Covariance Médiane, avant d’en donner des estimateurs récursifs. Cette matrice, sous certaines hypothèses, a les mêmes sous-espaces propres que la matrice de covariance, mais est moins sensible aux données atypiques, et est donc très intéressante pour l’Analyse en Composantes Principales Robuste. Travail joint avec Hervé Cardot et Peggy Cénac (Université de Bourgogne).
Automates cellulaires probabilistes de mémoire 2
21 décembre 2017 10:45-11:45 -Oratrice ou orateur : Jérôme Casse
Résumé :
Ces travaux ont été effectués en collaboration avec Irène Marcovici.
Un automate cellulaire probabiliste (ACP) de mémoire 2 est un algorithme stochastique qui transforme 2 mots bi-infinis $a = eta_0 = (a_i)_{i in Z}$ et $b = eta_1 = (b_i)_{i in Z}$ en un troisième $c = eta_3 = (c_i)_{i in Z}$ de tel sorte que la loi de la lettre $c_i$ ne dépend que des lettres $(b_i,a_{i+1},b_{i+1})$. Les lettres $c_i$ sont choisies de manière synchrone et indépendante. Après avoir obtenu le mot $c$, on peut ré-appliquer l’ACP en prenant en entrée les mots $(b,c)$ et ainsi de suite. On obtient alors une suite de mots $(eta_t)_{t > 0}$ dont les lettres $(eta_t(i))$ forme ce que l’on appelle le diagramme espace-temps.
Ces ACP de mémoire 2 ont été initialement définis pour étudier le modèle à 8 sommets et nous verrons qu’ils sont également liés à d’autres modèles de la physique statistique comme, par exemple, un nouveau modèle de TASEP synchrone ou le modèle d’Eden dans le demi-plan sur le réseau triangulaire.
Dans cet exposé, nous étudierons les lois invariantes de ces ACP, l’ergodicité de ces derniers, ainsi que les propriétés d’invariance de leur diagramme espace-temps. Ce sont des problèmes insolubles dans le cas général (y compris pour les ACP à mémoire 1) et pour cela nous verrons que nous devons restreindre l’étude à des cas o๠la loi invariante est de type mesure produit ou de type Markov.
S’il nous reste un peu de temps à la fin, nous verrons comme les méthodes employées dans cet exposé permettent de déduire rapidement des propriétés sur un modèle de TASEP synchrone
généralisé.
Estimation of Functional Sparsity in Nonparametric Varying Coefficient Models for Longitudinal Data Analysis
14 décembre 2017 10:45-11:45 -Oratrice ou orateur : Juhyun Park
Résumé :
We study the simultaneous domain selection problem for varying coefficient models as a functional regression model for longitudinal data with many covariates. The domain selection problem in functional regression mostly appears under the functional linear regression with scalar response but there is no direct correspondence to functional response models with many covariates. We reformulate the problem as nonparametric function estimation under the notation of « functional sparsity ». Sparsity is the recurrent theme that encapsulates interpretability in the face of regression with multiple inputs, and the problem of sparse estimation is well understood in the parametric setting as variable selection. For nonparametric models, interpretability not only concerns the number of covariates involved but also the {em functional form} of the estimates, and so the sparsity consideration is much more complex. To distinguish the types of sparsity in nonparametric models, we call the former « global sparsity » and the latter « local sparsity », which constitute functional sparsity. Most existing methods focus on directly extending the framework of parametric sparsity for linear models to nonparametric function estimation to address one or the other, but not both. We develop a penalized estimation procedure that simultaneously addresses both types of sparsity in a unified framework. We establish asymptotic properties of estimation consistency and sparsistency of the proposed method. Our method is illustrated in simulation study and real data analysis, and is shown to outperform the existing methods in identifying both local sparsity and global sparsity.
[this is a joint work with Catherine Y. Tu and Haonan Wang from Colorado State University, U.S.A.]
Convergence de la DSF vers le BW
7 décembre 2017 10:45-11:45 -Oratrice ou orateur : TRAN Viet Chi
Résumé :
Nous considérons, sur le plan, la DSF (Directed Spanning Forest) qui est une forêt dirigée introduite par Baccelli et Bordenave (2007). Soient un processus de Poisson homogène dans le plan et une direction privilégiée (par exemple -e_y). Nous définissons l’ancêtre de chaque atome du processus de Poisson comme étant l’atome le plus proche (pour la distance euclidienne) et d’ordonnée supérieure. Le graphe résultant est la DSF : il s’agit d’une forêt, et même presque sà»rement d’un arbre. Sous de bonnes renormalisations, nous montrons que cette forêt converge en loi vers la toile Brownienne (BW, comme Brownian Web). Dans le cas de la DSF, la difficulté majeure est que la construction, pourtant simple et naturelle, crée des dépendances géométriques très complexes : au fur et à mesure de la construction du graphe, on accumule une information sur la vacuité de certaines régions (aléatoires) du plan. Les critères de convergence existant dans la littérature s’appuient sur des estimées obtenues en général par la construction de martingales ou chaînes de Markov, constructions qui sont impossibles ici. L’obtention de ces estimées clé s’appuie sur des idées de renouvellement fondées sur la géométrie du problème.
Ceci est un travail en commun avec D. Coupier, K. Saha et A. Sarkar.
Exposé à la Journée de la Fédération Charles Hermite "Apprentissage, machine learning" au LORIA
30 novembre 2017 10:45-11:45 -Oratrice ou orateur : Gilles Blanchard
Résumé :
Exposé dans le cadre du Forum des jeunes mathématiciennes et mathématiciens (lieu: amphi 5, Nancy)
23 novembre 2017 10:45-11:45 -Oratrice ou orateur : Marie-Pierre Etienne
Résumé :
Large-scale structure of the Universe: observer's point of view
16 novembre 2017 10:45-11:45 -Oratrice ou orateur : Elmo Tempel
Résumé :
The cosmic web is a highly complex geometrical pattern, with galaxy clusters at the intersection of filaments and filaments at the intersection of walls. Using observational data, we can visually recognize the main components of the cosmic web: voids, filaments and (super)clusters. However, to classify the cosmic web using mathematical methods is much more complicated task, which also involves the analysis of observational selection effects. In my talk I will give a brief overview about the observed large-scale structure together with the main selection effects that should be taken into account while analyzing the data.
Risques garantis pour les systèmes discriminants multi-classes à marge
9 novembre 2017 10:45-11:45 -Oratrice ou orateur : Yann Guermeur
Résumé :
La théorie statistique de l’apprentissage porte sur trois problèmes d’inférence empirique : la discrimination, la régression et l’estimation de la fonction de densité. Cette présentation se concentre sur la discrimination. Nous exposons les garanties disponibles sur les performances en généralisation des systèmes discriminants (risques garantis), en privilégiant le cas o๠ceux-ci s’appuient sur le concept de marge. L’intervalle de confiance de ces risques garantis dépend de trois paramètres principaux : la taille m de l’échantillon, le nombre C de catégories et la valeur gamma du paramètre de marge. Nous caractérisons cette dépendance en fonction du choix de la fonction de perte.
Identification et caractérisation de l'isotropie des champs aléatoires déformés via leurs ensembles d'excursion
19 octobre 2017 10:45-11:45 -Oratrice ou orateur : Julie Fournier
Résumé :
Une application déterministe $theta$ de $R^2$ dans lui-même déforme le plan de façon bijective et régulière. Avec un champ aléatoire $X$ réel et défini sur $R^2$, régulier, stationnaire et isotrope, elle entre dans la construction d’un champ déformé défini comme la composée de $X$ avec $theta$. Un champ déformé est en général anisotrope, cependant certaines applications $theta$, dont on propose une caractérisation explicite, préservent l’isotropie. En supposant en outre que $X$ est gaussien, on définit une forme faible d’isotropie d’un champ déformé par une condition d’invariance de la caractéristique d’Euler moyenne de certains de ses ensembles d’excursion. On prouve que les champs déformés satisfaisant cette définition sont en réalité isotropes en loi. Dans une dernière partie de l’exposé, en supposant connue la caractéristique d’Euler moyenne de certains ensembles d’excursion d’un champ déformé, on prouve qu’il est possible d’identifier la déformation $theta$ associée.
Time series and long memory
28 septembre 2017 10:45-11:45 -Oratrice ou orateur : Marianne Clausel
Résumé :
Sur des équations aux dérivées partielles à coefficients constants par morceaux
14 septembre 2017 10:45-11:45 -Oratrice ou orateur : Zili Mounir
Résumé :
On présente la solution fondamentale d’une équation aux dérivées partielles à coefficient constants par morceaux. De telles équations apparaissent, entre autres, lors de la modélisation de la diffusion de particules dans des milieux hétérogènes. Partant d’une représentation probabiliste de la solution, on explicite un développement asymptotique en temps petits, utilisable dans les applications concrètes.
Fonctionnelles de coà»t sur des arbres aléatoires
15 juin 2017 10:45-11:45 -Oratrice ou orateur : Marion Sciauveau
Résumé :
Les arbres apparaissent naturellement dans de nombreux domaines tels que l’informatique pour le stockage de données ou encore la biologie pour classer des espèces dans des arbres phylogénétiques.
Dans cet exposé, nous nous intéresserons aux limites de fonctionnelles additives de grands arbres aléatoires. Nous étudierons les cas des arbres binaires sous le modèle de Catalan (arbres aléatoires choisis uniformément parmi les arbres binaires enracinés complets ordonnés avec un nombre de nÅ“ud donné) et les arbres simplement générés. On obtiendra un principe d’invariance pour ces fonctionnelles ainsi que les fluctuations associées.
Dans le cas binaire, la preuve repose sur le lien entre les arbres binaires et l’excursion brownienne normalisée (voir Aldous [1]). Cela nous permettra de retrouver les résultats avancés par Fill et Kapur [2] et Fill et Janson [3].
Références :
[1] : D. Aldous. The continuum random tree. III. (1993)
[2] : J.A. Fill and N.Kapur. Limiting distributions for additive functionals on Catalan trees (2004)
[3] : J.A. Fill and S. Janson. Precise logarithmics for the right tails of some limit random variables for random trees (2009)
Concentration inequalities for regenerative and Harris recurrent Markov chains with applications to statistical learning
18 mai 2017 10:45-11:45 -Oratrice ou orateur : Gabriela Ciolek
Résumé :
Concentration inequalities are very often a crucial step in deriving many results in statistical learning. The purpose of this talk is to present Bernstein and Hoeffding type maximal inequalities for regenerative Markov chains. Furthermore, we generalize these results and show exponential bounds for suprema of empirical processes over a class of functions F which size is controlled by its uniform entropy number. We show also that concentration inequalities are possible to obtain when the chain is sub-geometric. All constants involved in the bounds of the considered inequalities are given in an explicit form which can be advantageous in practical considerations. We show that the inequalities obtained for regenerative Markov chains can be easily generalized to a Harris recurrent case. Finally we provide one example of application of presented inequalities in statistical learning theory and obtain generalization bounds for mimimum volume set estimation problem when the data are Markovian.