Message-passing algorithms and homology : from thermodynamics to statistical learning - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

Message-passing algorithms and homology : from thermodynamics to statistical learning

Algorithmes à propagation de messages et homologie

Résumé

Message-passing algorithms consist of a parallelised computing scheme to estimate the marginals of a high-dimensional probability distribution. They have been used in various areas where the statistics of a large number of interacting variables have to be studied, including statistical physics, artificial intelligence, decoding in information theory. This thesis desctibes the algebraic and topological structures in which message-passing algorithms naturally take place. In most applications, the probability distribution p is defined by a Markov field or graphical model, i.e. as a product of local factors depending only on small subsets of interacting variables. Equivalently, the total energy H = - ln p (or log-likelihood) is a sum of local interaction potentials. Embedding potentials as the 0-degree subspace of a chain complex of local observables, we show that this constraint is equivalent to assuming a one-to-one parametrisation of total energies by homology classes of interaction potentials. The 1-chains of this complex are statistical analogs of heat fluxes. The evolution of potentials up to the boundary of a heat flux, preserving total energy, produces new belief propagation algorithms as continuous-time diffusion equations. The consistency of pseudo-marginals one seeks to approximate is reciprocally translated by a cohomological constraint, demanding that a collection of local probability distributions has a vanishing differential. The local potentials and local distributions form a pair of dual variables put in correspondence by a smooth non-linear functional, essentially composing the exponential with a sum over subsets, called zeta transform in combinatorics. Pairs at the intersection of the energy conservation and marginal consistency constraint surfaces are shown to be in correspondence with both the stationary points of belief propagation algorithms and the critical points of a local approximation of free energy, computed by the Bethe-Kikuchi combinatorial method, a truncation of the Möbius inversion of the zeta transform.
Les algorithmes à propagation de messages constituent un schéma de calcul parallèle pour estimer les marginales d’une loi de probabilité de haute dimension. Ils ont été employés dans des domaines variés où la statistique d’un grand nombre de variables en interaction doit être étudiée, comme la physique statistique, l’intelligence artificielle, le décodage en théorie de l’information. Cette thèse décrit les structures algébriques et topologiques naturelles où se déroulent la propagation de messages. Dans la plupart des applications, la loi de probabilité p est définie par un champ de Markov ou modèle graphique, i.e. par un produit de facteurs locaux qui ne dépendent que d’un petit sous-ensemble de variables en interaction. De manière équivalente, l’énergie totale H = ln p (ou log-vraisemblance) est une somme de potentiels d’interaction locaux. Nous montrons que cette contrainte est équivalente à l’existence d’une paramétrisation biunivoque de l’énergie totale par les classes d’homologie de potentiels locaux, en immergeant les potentiels comme sous-espace de degré 0 d’un complexe de chaînes d’observables locales. Les 1-chaînes de ce complexe sont un analogue statistique des flux de chaleur. L’évolution de potentiels à un bord de flux de chaleur près, préservant l’énergie totale, produit de nouveaux algorithmes à propagation de croyances comme des équations de diffusion à temps continu. La consistance des pseudo-marginales que l’on cherche à approximer est réciproquement traduite par une contrainte cohomologique, demandant que la collection de probabilités locales ait une différentielle nulle. Les potentiels locaux et les probabilités locales forment une paire de variables duales, reliées par une fonctionnelle lisse et non-linéaire, composant essentiellement l’exponentielle avec une somme sur les sous-parties appelée transformée zeta en combinatoire. Les paires à l’intersection des surfaces de contrainte associées à la conservation de l’énergie et à la consistance marginale respectivement sont mises en correspondance avec les points stationnaires des algorithmes à propagation de croyance d’une part, et avec les points critiques d’une approximation locale de l’énergie libre, obtenue par la méthode combinatoire de Bethe-Kikuchi (en tronquant la transformée de Möbius, inverse de la transformée zeta) d’autre part.
Fichier principal
Vignette du fichier
PELTRE_Olivier_va.pdf (1.5 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03390824 , version 1 (21-10-2021)

Identifiants

  • HAL Id : tel-03390824 , version 1

Citer

Olivier Peltre. Message-passing algorithms and homology : from thermodynamics to statistical learning. Algebraic Topology [math.AT]. Université Paris Cité, 2020. English. ⟨NNT : 2020UNIP7224⟩. ⟨tel-03390824⟩
60 Consultations
221 Téléchargements

Partager

Gmail Facebook X LinkedIn More