Skip to Main content Skip to Navigation
Theses

Novel Pattern Mining Techniques for Genome-wide Association Studies

Hoang Son Pham 1, 2
1 GenScale - Scalable, Optimized and Parallel Algorithms for Genomics
Inria Rennes – Bretagne Atlantique , IRISA-D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE
2 LACODAM - Large Scale Collaborative Data Mining
Inria Rennes – Bretagne Atlantique , IRISA-D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE
Résumé : Les études d’association sur un génome complet (GWAS) sont conçues pour découvrir les combinaisons de points de polymorphisme (SNP) associées à des maladies. La découverte de ces associations permet d’élaborer de meilleures stratégies pour détecter, traiter ou prévenir les maladies. Récemment, l’utilisation de techniques d’extraction de patterns discriminatif a été investiguée dans le cadre de problématiques GWAS. Toutefois, la découverte de combinaisons de SNP dans de grands jeux de données GWAS est encore difficile à cause de la complexité des algorithmes utilisés. La thèse se propose donc d’améliorer l’état de l’art des approches d’extraction de motifs discriminants, dans le cadre d’extraction de combinaisons de SNP corrélées à un phénotype d’intérêt. Plusieurs solutions ont été proposées, s’attaquant aux problèmes majeurs en GWAS : évaluation de la force d’association, découverte efficace de combinaisons de SNP et visualisation de ces combinaisons. Les approches proposées sont également prometteuses pour d’autres tâches de bioinformatique comme la découverte d’expressions génique, la détection de motifs de phosphorylation et la détection de motifs de régulation.
Complete list of metadatas

Cited literature [125 references]  Display  Hide  Download

https://hal.inria.fr/tel-01672442
Contributor : Hoang-Son Pham <>
Submitted on : Monday, December 25, 2017 - 11:30:44 AM
Last modification on : Wednesday, June 24, 2020 - 4:19:48 PM

File

Thesis_Son.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-01672442, version 1

Citation

Hoang Son Pham. Novel Pattern Mining Techniques for Genome-wide Association Studies. Bioinformatics [q-bio.QM]. IRISA, equipe GENSCALE, 2017. English. ⟨tel-01672442⟩

Share

Metrics

Record views

605

Files downloads

375