Date/heure
6 novembre 2018
14:00 - 15:00
Oratrice ou orateur
Martin Royer
Catégorie d'évènement Séminaire des doctorants
Résumé
On va évoquer le problème du partitionnement (« clustering ») d’un ensemble d’entités en K groupes avec un modèle statistique : peut-on discerner des groupes dans ces entités (par exemple des familles de gènes ou des régions du cerveau) de façon optimale, non-asymptotique, en grande dimension ? En étudiant l’estimateur classique des K-moyennes, on donne des éléments de réponse grâce au lien qu’il entretient avec l’optimisation convexe, ce qui permet aussi d’éclairer notre compréhension d’autres estimateurs comme les estimateurs spectraux.
Quelques références :
– Approximating K-means-type Clustering via Semidefinite Programming, Jiming Peng, Yu Wei, 2007
– PECOK: a convex optimization approach to variable clustering, F. Bunea, C. Giraud, M. R. and N. Verzelen, 2016