Algorithmique paramétrée exacte pour la bioinformatique structurale des ARNs - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2023

Exact Parameterized Algorithmics for Structural RNA Bioinformatics

Algorithmique paramétrée exacte pour la bioinformatique structurale des ARNs

Résumé

RNAs are one of the fundamental building blocks of life, along with DNA and proteins. If they are mostly known as a mere intermediate in the synthesis of proteins (messenger RNAs), they may also act directly as RNA to perform a wide variety of functions (catalysis, expression regulation…). For these non-coding RNAs, the folded structures they adopt are crucial. Both RNA sequences and structures display an inherently combinatorial nature: sequences are words over A,U,G,C, while structures mainly consist of A-U, G-C and G-U base-pairs. Several fundamental computational problems involving functional RNAs are therefore naturally expressed in the language of discrete mathematics. Such problems include RNA folding (what is the preferred structure of a sequence?), RNA Design (how do I find a sequence that would fold into a given structure?) or RNA Energy Barrier (is there a feasible transition between two structures?). Some of these fundamental problems are NP-hard, but still need to be solved by RNA bioinformaticians in practice, either to better understand biological systems or for the development of RNA therapeutics (e.g. COVID19 vaccines). These potential applications, combined with the ever-increasing amount of sequencing data available, mean there is a dire need for efficient methods. The philosophy of this PhD thesis is to explore the possibility of applying parameterized algorithmics, a relatively recent and very dynamic field of algorithmic research, to hard structural RNA bioinformatics problems. A particular focus is given to graph formulations and graph width measures as parameters.
Les ARNs (Acides Ribo-Nucléiques) constituent, avec l’ADN et les protéines, l’un des blocs élémentaires sur lesquels sont construits tous les systèmes biologiques. Si ils sont surtout connus comme étant de simples intermédiaires dans la synthèse de protéines (ARNs messagers), ils peuvent aussi agir directement en tant qu’ARN, et remplir alors des rôles très variés (catalyse, régulation de l’expression de gènes…). Pour ces ARNs dits non-codants, la structure de repliement qu’ils adoptent est cruciale. À la fois les séquences et les structures d’ARN présentent un aspect intrinsèquement combinatoire: les séquences sont des mots sur l’alphabet A,U,G,C, tandis que les structures sont principalement constituées de paires de bases A-U, G-C et G-U. Plusieurs problèmes fondamentaux impliquant les ARNs non-codant sont par conséquent naturellement exprimés dans le language des mathématiques discrètes. Ces problèmes incluent le repliement (Quelle est la structure préférentielle d’une séquence donnée ?), le design d’ARN (Comment trouver une séquence se repliant selon une structure spécifiée en entrée ?) ou le calcul de barrières d’énergie (Y’a-t-il une transition entre deux structures susceptible de survenir spontanément ?). Certains de ces problèmes fondamentaux sont NP-difficile, mais les bioinformaticiens de l’ARN doivent tout de même les résoudre quotidiennement, soit pour mieux comprendre les systèmes biologiques naturels, soit pour le développement de thérapies à base d’ARN (dont les vaccins contre le COVID19 sont un exemple). Étant donné également les quantités toujours plus grandes de données de séquençage à traiter, il y a un besoin croissant de méthodes algorithmiques efficaces pour les problèmes mentionnés ci-dessus. La philosophie de cette thèse de doctorat est d’explorer les possibilités d’application de l’algorithmie paramétrée, un domaine relativement récent et très dynamique de la recherche algorithmique, à des problèmes difficiles de bioinformatique des ARNs. Une attention particulière est donnée aux formulations en termes de graphes, et à des paramètres de largeurs de graphes.
Fichier principal
Vignette du fichier
123574_MARCHAND_2023_archivage-4.pdf (6.47 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-04404102 , version 1 (18-01-2024)

Licence

Paternité - Pas d'utilisation commerciale

Identifiants

  • HAL Id : tel-04404102 , version 1

Citer

Bertrand Marchand. Algorithmique paramétrée exacte pour la bioinformatique structurale des ARNs. Bio-informatique [q-bio.QM]. Ecole Polytechnique, 2023. Français. ⟨NNT : 2023IPPAX072⟩. ⟨tel-04404102⟩
32 Consultations
31 Téléchargements

Partager

Gmail Facebook X LinkedIn More