Laboratoire de Probabilités, Statistique et Modélisation (LPSM, UMR 8001)




Le LPSM est une unité mixte de recherche (UMR 8001) dépendant du CNRS, de Sorbonne Université et de l’Université Paris Cité. Le laboratoire compte environ 200 personnes (dont env. 90 permanents), répartis sur deux sites (Campus P. et M. Curie de Sorbonne Université et Campus Paris Rive Gauche de l’Université Paris Cité).

Les activités de recherche du LPSM couvrent un large spectre en Probabilités et Statistique, depuis les aspects les plus fondamentaux (qui incluent notamment l'Analyse Stochastique, la Géométrie Aléatoire, les Probabilités Numériques et les Systèmes Dynamiques) jusqu’aux applications à la Modélisation dans diverses disciplines (Physique, Biologie, Sciences des Données, Finance, Actuariat, etc), applications qui incluent des partenariats en dehors du monde académique.

Le LPSM est un laboratoire relativement récent. Cependant, ses composantes sont anciennes et proviennent du développement des « mathématiques du hasard » dans le centre de Paris, depuis le premier quart du 20ième siècle (voir ici pour plus de détails).

NB: Site largement inspiré de celui de l'IRIF (merci à eux pour la mise à disposition de leur maquette).

vernier.jpg

9.9.2024
Le projet “New algebraic structures in quantum integrability: towards 3D” porté par Eric Vernier à reçu un financement JCJC de l'ANR, ainsi qu'un financement Emergence de l'Université Paris Cité.

12.9.2024
Lancement du séminaire sur les processus de Hawkes, qui aura lieu les mardis à 11h sur le site de Jussieu. Programme ici.

zambotti.jpg

9.9.2024
Lorenzo Zambotti est lauréat du Prix Frontiers of Science pour son article Algebraic renormalisation of regularity structures paru dans Inventiones Mathematicae. Félicitations à Lorenzo!

6.6.2024
Félicitations Gérard Biau et Cyril Labbé, nouveaux membres de l'IUF !


(Ces actualités sont présentées selon un classement mêlant priorité et aléatoire.)

Soutenances de thèse
Jeudi 19 septembre 2024, 9 heures, 16-26 113
Arsen Sultanov (LPSM) Generative Model-Based Exploration of Chemical Space for Crystals

Machine learning is a powerful tool for approximating and partially replacing resource-intensive computations. It is known to play an important role in modern materials science and especially in materials design. In this work, we develop and employ generative machine learning approaches as a means to find new potentially stable crystal structures. As our main contribution we develop a model that is capable of generating new crystals with predefined symmetries and composition. We also propose an algorithm that chooses the best symmetry constraints given a chemical composition. We then illustrate the proposed methods on some chemical systems of interest, showcasing its potential uses in practical tasks.

Événements du LPSM
Jeudi 19 septembre 2024, 9 heures 30, Amphi Turing, Bâtiment Sophie Germain, Campus des Grands Moulins
Journée de rentrée 2024

Programme:

9h10 Accueil

9h30 Céline Duval 10h Maxime Egea

10h30 Pause

11h Anna Erschler 11h30 Ngoc-Tam Le 12h00 Céline Lévy-Leduc

12h30 Déjeuner buffet

14h00 Raphaël Bertier 14h30 Laura Sansonnet

Séminaire sur les processus de Hawkes
Mardi 24 septembre 2024, 11 heures, Jussieu, Salle Emile Borel, 15-26 201
Miguel Martinez Herrera (LPSM, SU) Noisy Hawkes process inference

Les probas du vendredi
Vendredi 27 septembre 2024, 11 heures, Jussieu, Salle Paul Lévy, 16-26 209
Francesco Caravenna (Université de Milano-Bicocca) About noise sensitivity

Séminaire de Probabilités
Mardi 1 octobre 2024, 14 heures, Jussieu, Salle Paul Lévy, 16-26 209
Fanny Augeri (LPSM) A venir

Séminaire de statistique
Mardi 1 octobre 2024, 9 heures 30, Jussieu en salle 15-16.201
Marc Hoffmann (CEREMADE) Sur l'estimation d'une diffusion multidimensionnelle

Alors que l'estimation des coefficients d'une diffusion scalaire semblait bien comprise (minimax, adaptatif, bayésien non-paramétrique) au début des années 2000, alors que la statistique des semi-martingales s'est résolument tournée vers la finance statistique, ces dernières années voient réapparaître le problème de l'estimation du champ de vecteur de dérive et de la matrice de diffusion pour un processus de diffusion multivarié, notamment sous l'influence de questions de ML et de problèmes inverses bayésiens.

Dans cet exposé, issu de travaux en commun avec Chiara Amorino, Claudia Strauch et aussi Kolyan Ray, nous montrons que si l'on se contente d'un programme théorique non-paramétrique classique (perte L^2, minimax adaptatif à la Lepski, mais pas tellement plus), alors il est possible d'obtenir des résultats relativement généraux qui améliorent en dimension arbitraire ce que l'on connaît, et ceci dans plusieurs directions : pour (i) des observations en temps grand avec pas de discrétisation arbitrairement lent (ii) une réflexion du processus aux bords d'un domaine, mais pas forcément (iii) des situations où la diffusion peut dégénérer, ce qui permet d'inclure des modèles de type position-vitesse ; (iv) dans certains cas (conductivité, schémas rapides) des vitesses de contraction bayésiennes.

L'approche est toujours un peu la même : pour les bornes supérieures, construire une équivalence de modèle par un schéma de régression martingale, découpler les propriétés de concentration du bruit martingale de la “vitesse de remplissage” de l'espace par le “design” (souvent mal connue, ou tout au moins difficile à estimer) ; pour les bornes inférieures, des méthodes perturbatives utilisant un peu de calcul de Malliavin et pour les résultats bayésiens, plus fins, des développements en temps petit du noyau de la chaleur pour une “bonne” géométrie.

Séminaire de Probabilités
Mardi 8 octobre 2024, 14 heures, Jussieu, Salle Paul Lévy, 16-26 209
Daniel Kious (Bath) Sharp threshold for the ballisticity of the random walk on the exclusion process

Séminaire de statistique
Mardi 15 octobre 2024, 9 heures 30, Sophie Germain en salle 1016
Waiss Azizian (LJK) What is the long-run distribution of stochastic gradient descent? A large deviations analysis

In this work, we examine the long-run distribution of stochastic gradient descent (SGD) in general, non-convex problems. Specifically, we seek to understand which regions of the problem's state space are more likely to be visited by SGD, and by how much. Using an approach based on the theory of large deviations and randomly perturbed dynamical systems, we show that the long-run distribution of SGD resembles the Boltzmann-Gibbs distribution of equilibrium thermodynamics with temperature equal to the method's step-size and energy levels determined by the problem's objective and the statistics of the noise. In particular, we show that, in the long run, (a) the problem's critical region is visited exponentially more often than any non-critical region; (b) the iterates of SGD are exponentially concentrated around the problem's minimum energy state (which does not always coincide with the global minimum of the objective); © all other connected components of critical points are visited with frequency that is exponentially proportional to their energy level; and, finally (d) any component of local maximizers or saddle points is “dominated” by a component of local minimizers which is visited exponentially more often.

This is a joint work with Franck Iutzeler, Jérôme Malick, Panayotis Mertikopoulos

Séminaire sur les processus de Hawkes
Mardi 15 octobre 2024, 11 heures, Jussieu, Salle Emile Borel, 15-26 201
Fabien Baeriswyl (SU & Lausanne) Non encore annoncé.