Évènements

Estimation simultanée d'un modèle à  une équation structurelle et de ses facteurs latents par algorithme EM

Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 15 février 2018 09:15-10:15 Lieu : Oratrice ou orateur : Myriam Tami Résumé :

Les modèles d’équations structurelles à  variables latentes permettent de modéliser des relations entre des variables observables et non observables. Les deux paradigmes actuels d’estimation de ces modèles sont les méthodes de moindres carrés partiels sur composantes et l’analyse de la structure de covariance.

Respectivement, les méthodes d’estimation les plus populaires sont PLS-PM (Partial Least Squares Path Modeling) et CBSEM (Covariance-Based Structural Equation Modeling). Dans ce travail nous proposons une approche d’estimation alternative fondée sur la maximisation par algorithme EM de la vraisemblance globale du modèle tenant compte de l’ensemble des équations le constituant. Cette approche EM est développée pour le cas d’un modèle à  une seule équation structurelle o๠les variables latentes sont des facteurs eux même liés à  de multiples blocs de variables observables. Nous en étudierons les performances sur des données synthétiques et nous proposerons, via une application sur des données réelles environnementales, comment construire pratiquement un modèle et en évaluer la qualité. Enfin, nous présenterons une application de l’approche développée dans le contexte d’un essai clinique en cancérologie pour l’étude de données longitudinales de qualité de vie. Nous montrerons que par la réduction efficace de la dimension des données, l’approche EM simplifie l’analyse longitudinale de la qualité de vie en évitant les tests multiples. Ainsi, elle contribue à  faciliter l’évaluation du bénéfice clinique d’un traitement.


Variational Inference in the Poisson lognormal model for multivariate analysis in ecology

Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 15 février 2018 10:45-11:45 Lieu : Oratrice ou orateur : Julien Chiquet Résumé :

Many application domains such as ecology or genomics have to deal with multivariate count data. A typical example is the joint observation of the respective abundances of a set of species in a series of sites, aiming to understand the co-variations between these species. The Gaussian setting provides a canonical way to model such dependencies, but does not apply in general. We adopt here the Poisson lognormal (PLN) model, which is attractive since it allows one to describe multivariate count data with a Poisson distribution as the emission law, while all the dependencies is kept in an hidden friendly multivariate Gaussian layer. While usual maximum likelihood based inference raises some issues in PLN, we show how to circumvent this issue by means of a variational algorithm for which gradient descent easily applies. We then derive several variants of our algorithm to apply PLN to PCA, LDA and sparse covariance inference on multivariate count data. We illustrate our method on microbial ecology datasets, and show the importance of accounting for covariate effects to better understand interactions between species.