Laboratoire de Probabilités, Statistique et Modélisation (LPSM, UMR 8001)




The LPSM is a research unit jointly supported by CNRS, Sorbonne Université and Université Paris Cité. The unit hosts about 200 members (about 90 faculty) and is located at two sites (Campus P. et M. Curie of Sorbonne Université et Campus Paris Rive Gauche of Université Paris Cité).

The LPSM research activities cover a broad spectrum in Probability and Statistics, from the most fundamental aspects (which, in particular, include Stochastic Analysis, Random Geometry, Numerical Probabilities and Dynamical Systems) to applications in the Modelling in various disciplines (Physics, Biology, Data Sciences, Finance, Insurance, etc). Applications involve partnerships with the non-academic sector.

While the unit LPSM is relatively recent, its components have deep roots in the rich history of the “mathematics of randomness” that has unfolded in Paris during the 20th century (see here for more details).

NB: This website is largely inspired by the one of IRIF.

france2030.jpg

9.12.2025
L'équipe composée de Claire Boyer (Saclay), Francis Bach (Inria) et Gérard Biau (LPSM) est lauréate de l'AAP “Mathématiques de l'apprentissage profond” du PEPR IA, pour le projet Géné-Pi. Félicitations!

9.12.2025
L'Académie des Sciences a décerné à Nicole El Karoui la médaille de section “Applications des Sciences”. Félicitations!


(Ces actualités sont présentées selon un classement mêlant priorité et aléatoire.)

/* TBA. */

/* Nombre limité d'évènements durant les vacances de printemps. Nombre limité d'évènements durant les vacances d'été. Nombre limité d'évènements durant les vacances de Noël. Tous les évènements sont actuellement organisés à distance. */

Soutenances d'habilitation
Jeudi 11 décembre 2025, 14 heures, Salle Paul Lévy, 16-26 209 et visioconférence
Sandro Franceschi (LPSM) Processus stochastiques réfléchis dans les cônes : approches analytiques, combinatoires et algébriques

Résumé: Mes recherches portent sur les processus stochastiques réfléchis impliqués dans plusieurs modèles, tels que les réseaux de files d’attente et les systèmes de particules en interaction. Les diffusions réfléchis dans des cônes y occupent une place centrale. Ces modèles stochastiques ont été développés en raison de leurs nombreuses applications en recherche opérationnelle, en théorie du risque, en finance, en télécommunications, en sciences des données et également en biologie des populations. Ces systèmes stochastiques soulèvent des questions relevant de nombreux domaines des mathématiques, notamment les probabilités, l’analyse complexe et harmonique, la combinatoire analytique et la théorie de Galois aux différences. L’unité de ces recherches repose sur l’analyse d’équations fonctionnelles à noyau caractérisant le comportement de ces processus. Pour les étudier, j’ai développé et adapté un ensemble de méthodes analytiques, combinatoires et algébriques : problèmes frontières de type Riemann–Hilbert et Carleman, méthode du point col sur une courbe elliptique, invariants de Tutte, théorie de Galois des équations aux différences, méthode par compensation. Historiquement conçues pour des modèles discrets et notamment des marches aléatoires, ces approches sont étendues ici au cadre continu et combinées à des outils de calcul stochastique, permettant ainsi d'étudier des diffusions. Ces méthodes offrent ainsi un cadre unifié pour aborder des problématiques variées : détermination de lois explicites, calcul de probabilités de fuite ou de persistance, construction de fonctions harmoniques, asymptotiques fines, description de frontières de Martin, classification algébrique et différentielle de fonctions génératrices et transformées de Laplace, étude de distributions stationnaires ou encore de fonctions de Green.

Séminaire de Probabilités
Mardi 16 décembre 2025, 14 heures, Jussieu, Salle Paul Lévy, 16-26 209
Irène Marcovici (Rouen) Fréquences des lettres dans des variantes de la suite d'Oldenburger-Kolakoski

La suite d'Oldenburger-Kolakoski (OK) est l'unique suite infinie sur l'alphabet {1,2} qui commence par un 1 et est un point fixe de l'application de codage par plage (c’est-à-dire, l’application qui donne les longueurs des blocs de chiffres identiques qui composent une suite). Cette suite est l’objet d’une célèbre conjecture, connue sour le nom de conjecture de Keane, selon laquelle les fréquences de 1 et de 2 dans cette suite existent et valent 1/2. 

Dans la première partie de cet exposé, nous introduirons des variantes probabilistes de la suite d’OK, et démontrerons des résultats portant sur la fréquence de 1 dans ces suites. Nous définirons ensuite la notion de « mot lisse », qui est une autre manière d’étendre le cadre d’étude, et évoquerons les propriétés des mots lisses sur l’alphabet {1,3}. 

La présentation reposera sur différentes collaborations (dont certaines encore en cours) avec C. Boisson, D. Jamet, L. Poirier, T. de la Rue.

Séminaire de Théorie Ergodique
Mardi 16 décembre 2025, 10 heures 30, Jussieu, Salle Paul Lévy, 16-26 209
Christophe Leuridan (Université de Grenoble I) Endomorphismes non dilatants du tore

On note η la mesure de Haar sur le tore Tᵈ. Tout endomorphisme surjectif T du groupe compact Tᵈ qui préserve la mesure de Haar est de la forme x ↦ Ax où A est une matrice à coefficients entiers de déterminant non nul. Les propriétés de T dépendent de la matrice A. En particulier, T est inversible si et seulement si |\det A| = 1, T est ergodique si et seulement si A n'a pas de valeur propre qui soit une racine de l'unité.

Nous nous intéressons à l'exactitude de T (la tribu asymptotique ∩ T⁻ⁿ(Tᵈ) est-elle triviale ?), au caractère Bernoulli de l'endomorphisme T et si oui, à la régularité du générateur.

Séminaire sur les processus de Hawkes
Mercredi 17 décembre 2025, 10 heures, Jussieu, TBA
Justin Baarq ANR Happy Manon Costa

Mathématiques financières et actuarielles, probabilités numériques
Jeudi 18 décembre 2025, 11 heures 15, Jussieu, Salle Paul Lévy, 16-26 209
Pierre Monmarché (Ecole des Ponts) Convergence locale et métastabilité pour des particules champ-moyen

On consider des particules dans un potentiel muli-puit attirées par leur barycentre (correspondant à l'approximation particulaire du flot Wasserstein d'une certaine énergie libre). Il est bien connu que ce système présente une transition de phase : à haute température, l'équation champ-moyen limite a une unique solution stationnaire, le système de N particules relaxe à l'équilibre à un taux indépendant de N et la propagation du chaos est uniforme en temps. À basse température, l'EDP non-linéaire a plusieurs solutions stationnaires et la limite du système de particules quand N et t vont à l'infini ne commutent pas. On va voir qu'il est cependant possible, en présence de plusieurs solutions stationnaires, d'obtenir des taux de convergence locale pour des conditions initiales dans certaines boules Wasserstein (collaboration avec Julien Reygner). Concernant la métastabilité du système de particules, on peut montrer que pour ces conditions initiales, le temps de sortie de la mesure empirique d'un voisinnage d'une solution stationnaire est exponentiellement large avec N et approximativement exponentielle, et que la propagation du chaos a lieu uniformément jusqu'au temps moyen de sortie (et donc, jusqu'à des temps exponentiellement grand avec N).

Séminaire doctoral du LPSM
Jeudi 18 décembre 2025, 17 heures 30, Jussieu - Salle Paul Lévy (16-26 209)
Chloé Hashimoto-Cullen + Emmanuel Gnabeyeu-Mbiada Time Series Forecasting with Variational Autoencoders: A PAC-Bayesian-driven Algorithm (C. Hashimoto-Cullen) + On Inhomogeneous Fractional Square-Root Process: Microstructural Foundation and Weak Stationarity Theory (E. Gnabeyeu-Mbiada)

Time series forecasting is increasingly important to applications ranging from the medical domain to finance and electricity consumption management, to name but a few. Yet, despite its practical importance, few algorithms come with strong theoretical guarantees, which means that there are no safeguards against sudden performance drops in new implementations. We propose a variational framework for time series forecasting, grounded in a novel PAC-Bayesian bound. Building on this bound, we introduce PAVE, a lightweight VQ-VAE-inspired algorithm. We provide new PAC-Bayesian bounds on the reconstruction error of time series VQ-VAE algorithms alongside a novel empirical framework.

We investigates the asymptotic behavior of time-modulated, renormalized, heavy-tailed, and nearly unstable Hawkes processes. We show that, under appropriate scaling, both the intensity processes and the rescaled Hawkes processes converge to a mean-reverting, time-inhomogeneous fractional square-root process and its integrated counterpart, respectively. We further investigate the properties of such limiting scaled time-inhomogeneous Volterra equations, including moment bounds, path regularity and stationarity through the lens of a weaker notion of stationarity referred to as “fake stationary regime” in the sense that all marginal distributions share the same expectation and variance. This offers a tractable proxy to stationarity in the finite horizon and lead to the classical weak L^2-stationarity in the long run (Functional weak asymptotics).

Les probas du vendredi
Vendredi 19 décembre 2025, 11 heures, Jussieu, Salle Paul Lévy, 16-26 209
Aurélien Velleret Dynamiques d'épidémies sur de grands graphes aléatoires et noyaux d'interaction

La prédiction de la propagation d'une épidémie au sein d'une population repose en grande partie sur des modèles simplifiés, dans lesquels les interactions sont représentées par des traits individuels. Ces traits caractérisent l'hétérogénéité de la population, tels que l'âge ou la profession des individus. Les méthodes d'échantillonnage habituelles visent à fournir des estimations de la relation entre les traits et les niveaux d'interaction, c'est-à-dire de la fonction définissant le noyau d'interaction dans le modèle. J'inclus ici le cadre des modèles à blocs stochastiques, avec un nombre fini de traits. À partir d'une description stochastique individu-centrée d'une épidémie se propageant sur un graphe aléatoire, nous analyserons la dynamique lorsque la taille $n$ du graphe tend vers l'infini. Quelle est la généralité d'une telle réduction de modèle au-delà du cas des graphes denses pour lesquels la notion de graphon (en tant que cas particulier du noyau d'interaction) a été initialement proposée ?

Avec un processus d'infection élémentaire entre individus, de type SIS, j'ai pu retrouver à la limite une équation intégrale-différentielle en dimension infinie étudiée par Delmas, Dronnier et Zitt (2022) pour une épidémie SIS se propageant sur un graphon, cf Delmas et al. 2024. Cette convergence couvre les cas des graphes denses et dilués, lorsque le nombre d'arêtes est de l'ordre de $0(n^a)$ avec $a\in(1,2]$ (le cas des graphes très dilués avec $a=1$ et des nombres bornés de voisins est de nature différente). Cela fournit une validation pour l'évaluation statistique actuelle, même si les individus sont généralement en contact avec une portion réduite de la population totale. Ces résultats peuvent être étendus à des histoires d'infection plus élaborées. Lorsque l'on considère des profils d'infectiosité qui varient avec la durée depuis l'événement d'infection, j'ai pu retrouver à la limite un processus structuré par l'âge qui étend la description proposée par Forien, Pang et Pardoux (2022) pour un nombre fini de traits individuels, cf Pardoux, Pang et Velleret (preprint).

Séminaire de statistique
Mardi 6 janvier 2026, 10 heures 45, Jussieu en salle 15-16 201
Scott Pesme (INRIA) (Old school) deep learning theory through the lens of diagonal linear networks

Surprisingly, many optimisation phenomena observed in complex neural networks also appear in so-called 2-layer diagonal linear networks. This rudimentary architecture—a two-layer feedforward linear network with a diagonal inner weight matrix—has the advantage of revealing key training characteristics while keeping the theoretical analysis clean and insightful.In this talk, I’ll provide an overview of various theoretical results for this architecture, while drawing connections to experimental observations from practical neural networks. Specifically, we’ll examine how hyperparameters such as the initialisation scale, step size, and batch size impact the optimisation trajectory and influence the generalisation performance of the recovered solution.

Séminaire Modélisation aléatoire du vivant
Mercredi 7 janvier 2026, 11 heures, 16-26.209
Valentin Schmutz (Univ. College London) Concentration of measure in “low-rank” biological neural networks

Recurrent neural networks with low-rank connectivity matrices are general and tractable models of collective dynamics in large networks. This class of models dates back to the seminal works of J. Hopfield (1982) and S. Amari (1972), and it still plays an instrumental role in computational neuroscience today. To highlight the analytical tractability of these models, I will first review some recent theoretical results concerning the case where the low-rank connectivity is random, the rank is kept fixed, and the number of neurons tends to infinity. In this case, we find that (i) the dynamics of the network converges to a neural field equation, (ii) the dynamics can be reduced to a latent, low-dimensional dynamical system, and (iii) the latent dynamics can be fully solved in certain special cases. In the second part of the presentation, I will show that low-rank connectivity is associated with remarkable concentration of measure phenomena in networks of biological neurons. Considering a feedforward network setup where neurons in the first layer, modelled as Cox processes, transmit stochastic spikes, I will present a theorem stating that the network can behave as if each spiking neuron were transmitting its subthreshold membrane potential as both the rank of the connectivity and the number of neurons tend to infinity. This result could explain how, at the network level, neurons can transmit their subthreshold membrane potential fluctuations through sparse spikes. The proof of the theorem involves the so-called thin shell phenomenon, a well-known concentration phenomenon in high-dimensional probability.