Classification des séquences d’ADN par les réseaux d’ondelettes - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2017

Classification of DNA sequences by wavelet networks

Classification des séquences d’ADN par les réseaux d’ondelettes

Résumé

now days, there has been an increasing interest in the research of the classification of the sequences of the DNA. However, despite the multiplicity at the level of methods and strategies used, a radical solution has been far from being obtained. In this study, we have tried to provide a contribution to the theoretical study of wavelet neural network and the theoretical study of the classification of the sequences of the DNA. We have developed a new approach. This approach is inspired by wavelet neural networks Beta. This network is built through a new method which combines a gradual algorithm and a predictor called the Least Trimmed Squares(LTS) or a selection method by orthogonalisation .We have relied on a new approach called Power Spectrum to identify the distribution of nucleotides at the level of DNA sequence. The evaluation of the approach used has been made through the use of many DNA data bases. To measure the degree of the efficiency of our model, we have applied many criteria of evaluation, such as, Precision, Recall and confusion matrix.
De nos jours, on assiste à une croissance exponentielle dans les études de classification des séquences d’ADN. Malgré la variété des méthodes de classification et des algorithmes réalisés, une solution radicale est loin d’être obtenue. Dans le cadre de cette thèse, nous avons apporté notre contribution à l’étude théorique de construction des réseaux d’ondelettes et à l’étude théorique de classification des séquences d’ADN. Nous avons développé une nouvelle approche qui permet d’assurer une classification non supervisée des séquences d’ADN. Cette approche est inspirée de réseau d’ondelettes Bêta. Ce réseau est construit à l’aide d’une nouvelle méthode qui combine un algorithme incrémental et un estimateur dit moindres carrés tronqués (Least trimmed Squares : LTS) ou la méthode de sélection par orthogonalisation et nous avons utilisé une nouvelle approche nommée spectre de puissance pour distinguer la distribution des nucléotides au niveau d’une séquence d’ADN. L’évaluation de notre approche a été fait par l’utilisation des plusieurs bases de données d’ADN. Pour mesurer la performance de notre modèle nous avons appliqué plusieurs critères d’évaluation par exemple : Précision, Rappel, Matrice de confusion.
Fichier principal
Vignette du fichier
These.pdf (5.13 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-01771864 , version 1 (19-04-2018)

Identifiants

  • HAL Id : tel-01771864 , version 1

Citer

Abdesselem Dakhli. Classification des séquences d’ADN par les réseaux d’ondelettes . Informatique [cs]. ENIS-SFAX, 2017. Français. ⟨NNT : ⟩. ⟨tel-01771864⟩
216 Consultations
182 Téléchargements

Partager

Gmail Facebook X LinkedIn More