30 2.3.1 La sélection vue comme un problème d'optimisation 30 2.3.2 Schéma général de la sélection d'attributs ,
Sélection 92 5.1.1 Analyse Discriminante Linéaire (ADL) 92 5.1.2 Cas d'un petit nombre d'échantillons, p.94 ,
95 5.2.1 Caractéristiques générales de l, 96 5.2.2 Représentation des individus, p.101 ,
Il convient de noter que nous ne pouvons pas savoir si les gènes entre les deux travaux sont différents ou pas, car ils ne les montrent est présenté une performance de 100% avec seulement 3 gènes, Comparaison de nos résultats avec d'autres travaux tenu avec 30 gènes Nous obtenons une performance de 95.3% avec un seul gène (AG-M2/Exp2) et 93.9% avec deux gènes, 2006. ,
Prostate nous avons la deuxième plus haute performance (96.0%) avec 8 gènes. La deuxième meilleure performance a été présentée dans, 0% en utilisant 30 gènes. Si nous considérons la taille la plus petite dans le sous-ensemble de gènes nous avons une bonne performance pour AG-M2/Exp1 (88.2%), 2004. ,
qui ne dépassent pas 70%, et pour le premier article nous trouvons que le nombre de gènes est très élevé Nous constatons que notre modèle AG-M2/Exp2 est capable de fournir une parfaite classification de 100% avec 24 gènes Le deuxième meilleur taux de classification est obtenu par la méthode de Nous avons alors la meilleure performance pour CNS avec un petit nombre de gènes. Par contre si l'on utilise SVM comme classifieur on fait mieux, car nous arrivons à une classification parfaite (100%) avec seulement 20 gènes (voir tableau 5.3) avec une population initiale égale à 30 Dans le jeu de données du cancer de l'ovarie nous trouvons la plus haute performance 100% avec 18 gènes. Nous notons que dans avec 75 gènes. Nous avons donc la meilleure performance avec un nombre minimal de gènes avec AG-M1/Exp2. Pour le jeu de donnés de DLBCL nous avons la meilleure performance avec le plus petit nombre de gènes Nous notons que le nombre de gènes rapportés dans les autres travaux sont au moins de 20 gènes pour avoir un bon taux de classification et ils n'arrivent pas à fournir une haute performance. La deuxième meilleure performance pour ce jeu a été présentée dans ] avec 30 gènes. Les résultats de cette analyse comparative avec d'autres méthodes proposées pour la sélection et la classification des données de puces à ADN nous ont permis de savoir à quel point notre approche est compétitive. Nous montrons que la méthode d'approche intégrée est capable de fournir des sous-ensembles de petite taille avec une haute perfor- mance, Un autre jeu de donnés difficiles à classer est celui du CNS. Normalement les taux de classification sont bien faibles comme dans les travaux de En utilisant le modèle AG-M1/Exp2, AG-M2/Exp2 nous avons une parfaite classification (100%) avec 4 gènes pour le premier modèle et 3 pour le deuxième Nous avons d'abord utilisée ADL comme classifieur, et puis nous nous sommes demandés si notre approche pouvait être adaptée à un autre classifieur tel que SVM. Les résultats obtenus avec SVM sont presque similaires à ceux rapportés avec ADL avec quelques différences pour certains jeux de données. ADL-AG permet ainsi d'envisager des méthodes d'approche intégrée en utilisant des autres méthodes de filtrage et de prévoir aussi la possibilité d'introduire peut-être de nouveaux facteurs de discrimination tels que Waveletes (Ondelettes) ou LPC's, 2003. ,
M76378 Human cysteine-rich protein (crp) gene 419 R44418 Ebna-2 nuclear protein (epstein-barr virus) [Furlanello et al., 2003] 389 H41017 Creatine kinase, ubiquitous mitochondrial 1033 M69066 Moesin (human);contains ptr5 repetitive ele- ment 758 T78104 Human proline-arginine-rich end leucine- rich 203 L12168 Homo sapiens adenylyl cyclase-associated 173 M19311 Human calmodulin mrna, complete cds. 1496 R35665 Epidermal growth factor receptor precursor 792 R88740 Atp synthase coupling factor 6, Synthèse du chapitre ID Code Description Références 493 R87126 Myosin heavy chain, nonmuscle, pp.211-47424, 1816. ,
Bagging predictors, Machine Learning, pp.123-140, 1984. ,
Classification and regression trees. California: Wadworth International, p.17, 1984. ,
A tutorial on support vector machines for pattern recognition. Data mining and knowledge discovery, pp.121-167, 1996. ,
Neural Fuzzy Systems: A Neuro-Fuzzy Synergism to Intelligent Systems, p.93, 1996. ,
Discriminative common vectors for face recognition, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.27, issue.1, pp.4-13, 2001. ,
DOI : 10.1109/TPAMI.2005.9
The practical handbook of genetic algorithms, applications. Chapman & Hall/CRC, pp.88-108, 2001. ,
Cancer classification using ensemble of neural networks with multiple significant gene subsets, Applied Intelligence, vol.6, issue.3, pp.243-250, 2005. ,
DOI : 10.1007/s10489-006-0020-4
Biomarker discovery in microarray gene expression data with Gaussian processes, Bioinformatics, vol.21, issue.16, pp.3385-3393, 2005. ,
DOI : 10.1093/bioinformatics/bti526
Data mining: A knowledge discovery approach, Cornuéjols et Miclet, pp.14-17, 2002. ,
Apprentissage artificielle: Concepts at algorithmes. Eyrolles, Cortes et Vapnik, p.16, 1995. ,
Support vector network. Learning machine, Cotta et Moscato, pp.1-25, 1995. ,
The k-Feature Set problem is W[2]-complete, Journal of Computer and System Sciences, vol.67, issue.4, pp.686-690, 2000. ,
DOI : 10.1016/S0022-0000(03)00081-3
An introduction to support vector machines, p.1, 2000. ,
Dimension reduction, pp.26-26, 2006. ,
Dimension Reduction for Classification with Gene Expression Microarray Data, Dash et Liu, pp.1-19, 1997. ,
DOI : 10.2202/1544-6115.1147
Feature selection for classification, Intelligent Data Analysis, vol.1, issue.1-4, pp.131-156, 1997. ,
DOI : 10.1016/S1088-467X(97)00008-5
Hybrid search of feature subsets, PRICAI98. Springer, 2006. ,
DOI : 10.1007/BFb0095273
Np-completeness of searches for smallest possible feature sets, Proceedings of the 1994 AAAI Fall Symposium on Relevance, p.35, 1994. ,
A rank sum test method for informative gene discovery, Proceedings of the 2004 ACM SIGKDD international conference on Knowledge discovery and data mining , KDD '04, 2004. ,
DOI : 10.1145/1014052.1014099
MINIMUM REDUNDANCY FEATURE SELECTION FROM MICROARRAY GENE EXPRESSION DATA, Journal of Bioinformatics and Computational Biology, vol.03, issue.02, pp.185-206, 2005. ,
DOI : 10.1142/S0219720005001004
Guest editorial: special section on ant colony optimization, IEEE Transactions on Evolutionary Computation, vol.6, issue.4, pp.317-319, 2002. ,
DOI : 10.1109/TEVC.2002.802446
Monte carlo feature selection for supervised classification (a statistical supplement), Bioinformatics, vol.24, issue.7 9, pp.100-117, 2003. ,
A practical approach to microarray data analysis, chapter Introduction to microarray data analysis, pp.1-46, 2003. ,
Feature extraction, foundations and applications, chapter Filter Methods, Series Studies in Fuzziness and Soft Computing, pp.89-118, 2006. ,
Pattern Classification, 2000. ,
Comparison of Discrimination Methods for the Classification of Tumors Using Gene Expression Data, Journal of the American Statistical Association, vol.97, issue.457, pp.77-87, 2002. ,
DOI : 10.1198/016214502753479248
Feature similarity based redundancy reduction for gene selection, DMIN, pp.357-360, 2006. ,
Statistical pattern recognition : Second edition, p.87, 1990. ,
Support vector machine classification and validation of cancer tissue samples using microarray expression data, Bioinformatics, vol.16, issue.10, pp.16906-914, 2000. ,
DOI : 10.1093/bioinformatics/16.10.906
Entropy-based gene ranking without selection bias for the predictive classification of microarray data, BMC Bioinformatics, vol.4, pp.1-20, 1997. ,
Eléments de logique floue, Hermes Sciences Publicat, p.7, 1997. ,
DNA Arrays:methods and protocols, chapter Ethical ramifications of genetic analysis using DNA arrays, pp.53-69, 2001. ,
Genetic Algorithms in Search, Optimization, and Machine Learning, 1989. ,
Molecular Classification of Cancer: Class Discovery and Class Prediction by Gene Expression Monitoring, Golub et Loan, pp.531-537, 1996. ,
DOI : 10.1126/science.286.5439.531
Singular value decomposition and least squares solutions, Numerische Mathematik, vol.11, issue.5, pp.403-420, 1970. ,
DOI : 10.1007/BF02163027
Translation of microarray data into clinically relevant cancer diagnostic tests using gene expression ratios in lung cancer and mesothelioma, Grabmeier et Rudolph, pp.4963-4967, 2002. ,
Techniques of cluster algorithms in data mining, Data Mining and Knowledge Discovery, vol.6, issue.4, pp.303-360, 2001. ,
DOI : 10.1023/A:1016308404627
DNA Arrays : methods and protocols, chapter Ethical ramifications of genetic analysis using DNA arrays, pp.53-69, 2001. ,
Gene selection for cancer classification using support vector machines, Machine Learning, pp.389-422, 2002. ,
An introduction to variable and feature selection, Journal of Machine Learning Research, vol.3, issue.70, pp.1157-1182, 2003. ,
Practical genetic algorithms, 2004. ,
DOI : 10.1002/0471671746
A genetic embedded approach for gene selection and classification, EVOBIO, pp.90-101, 2007. ,
Adaptation in Natural and Artificial Systems: An Introductory Analysis with Applications to Biology, Control, and Artificial Intelligence, 1975. ,
A Novel Microarray Gene Selection Method Based on Consistency, 2006 Sixth International Conference on Hybrid Intelligent Systems (HIS'06), pp.14-17, 2006. ,
DOI : 10.1109/HIS.2006.264897
A hybrid ga/svm approach for gene selection and classification of microarray data, In Lecture Notes in Computer Science. Applications of Evolutionary Computing, pp.34-44, 2006. ,
IMPROVED GENE SELECTION FOR CLASSIFICATION OF MICROARRAYS, Biocomputing 2003, pp.53-64, 2003. ,
DOI : 10.1142/9789812776303_0006
Data clustering: a review, ACM Computing Surveys, vol.31, issue.3, pp.264-323, 1999. ,
DOI : 10.1145/331499.331504
Feature selection: evaluation, application, and small sample performance, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.19, issue.2, pp.153-157, 1997. ,
DOI : 10.1109/34.574797
Neuro-fuzzy and soft computing, p.114, 1997. ,
Fuzzy-Rough Sets Assisted Attribute Selection, IEEE Transactions on Fuzzy Systems, vol.15, issue.1, pp.73-89, 2007. ,
DOI : 10.1109/TFUZZ.2006.889761
Performing Feature Selection with ACO, Swarm Intelligence in Data Mining, pp.45-73, 2006. ,
DOI : 10.1007/978-3-540-34956-3_3
Methods for evaluating gene expression from Affymetrix microarray datasets, BMC Bioinformatics, vol.9, issue.1, pp.1-10, 1994. ,
DOI : 10.1186/1471-2105-9-284
Irrelevant Features and the Subset Selection Problem, Proc. ICML, pp.121-129, 1973. ,
DOI : 10.1016/B978-1-55860-335-6.50023-4
Introduction à la théorie des sous-ensembles flous, Masson et Cie, 1973. ,
Swarm Intelligence, 2001. ,
DOI : 10.1007/0-387-27705-6_6
Prediction of colon cancer using an evolutionary neural network, Neurocomputing, vol.61, pp.361-379, 2004. ,
DOI : 10.1016/j.neucom.2003.11.008
Guide to analysis of DNA microarray data (second edition) Wiley-Liss, Kohavi et John, pp.26-35, 1997. ,
Wrappers for feature subset selection, Artificial Intelligence, vol.97, issue.1-2, pp.273-324, 1997. ,
DOI : 10.1016/S0004-3702(97)00043-X
An Introduction to Genetic Algorithms, 1999. ,
Evaluating Feature Selection Algorithms, CCIA-LNCS, vol.2504, pp.216-227, 2002. ,
DOI : 10.1007/3-540-36079-4_19
Feature selection algorithms: a survey and experimental evaluation, 2002 IEEE International Conference on Data Mining, 2002. Proceedings., pp.306-313, 2002. ,
DOI : 10.1109/ICDM.2002.1183917
SVM-RFE with Relevancy and Redundancy Criteria for Gene Selection, In Pattern Recognition in Bioinformatics Lecture Notes in Computer Science, vol.4774, pp.242-252, 2006. ,
DOI : 10.1007/978-3-540-75286-8_24
Feature extraction, foundations and applications, chapter, Series Studies in Fuzziness and Soft Computing, pp.139-167, 2006. ,
Tumor classification by partial least squares using microarray gene expression data, Bioinformatics, vol.18, issue.1, pp.39-50, 2002. ,
DOI : 10.1093/bioinformatics/18.1.39
Classification consistency analysis for bootstrapping gene selection, Neural Computing and Applications, pp.527-114, 2007. ,
DOI : 10.1007/s00521-007-0110-1
Distance Measure Assisted Rough Set Feature Selection, 2007 IEEE International Fuzzy Systems Conference, pp.1-6, 2007. ,
DOI : 10.1109/FUZZY.2007.4295518
Molecular classification of cancer types from microarray data using the combination of genetic algorithms and support vector machines, FEBS Letters, vol.3, issue.2, pp.358-362, 2003. ,
DOI : 10.1016/S0014-5793(03)01275-4
A hybrid approach for biomarker discovery from microarray gene expression data, Cancer Informatics, vol.2, pp.301-311, 2006. ,
Use of proteomic patterns in serum to identify ovarian cancer, The Lancet, vol.359, issue.9306, pp.572-577, 2002. ,
DOI : 10.1016/S0140-6736(02)07746-2
Prediction of central nervous system embryonal tumour outcome based on gene expression, Références bibliographiques, pp.436-442, 1993. ,
5: programs for machine learning, pp.12-36, 1993. ,
Variable selection using svm-based criteria, Machine Learning Research, vol.3, pp.1357-1370, 2003. ,
Classification of two-class cancer data reliably using evolutionary algorithms, Kanpur Genetic Algorithms Laboratory (KanGAL), 2003. ,
Genetic Algorithms Handbook of Metaheuristics, pp.55-82, 2003. ,
The Generalized LASSO, IEEE Transactions on Neural Networks, vol.15, issue.1, p.37, 2002. ,
DOI : 10.1109/TNN.2003.809398
A compendium to ensure computational reproductibility in high dimensional classification tasks, PARA, pp.939-948, 2004. ,
A review of feature selection techniques in bioinformatics, Bioinformatics, vol.23, issue.19, pp.2507-2517, 1990. ,
DOI : 10.1093/bioinformatics/btm344
The strength of weak learning, Machine Learning, pp.197-227, 1990. ,
Estimating the Mutual Information of an EEG-based Brain-Computer Interface, Biomedizinische Technik/Biomedical Engineering, vol.47, issue.1-2, p.7, 2002. ,
DOI : 10.1515/bmte.2002.47.1-2.3
Learning with kernels, 2001. ,
A combination of modified particle swarm optimization algorithm and support vector machine for gene selection and tumor classification, Talanta, vol.71, issue.4, pp.1679-1683, 2005. ,
DOI : 10.1016/j.talanta.2006.07.047
Feature dimension reduction for microarray data analysis using locally linear embedding, APBC, pp.211-217, 2005. ,
Gene expression correlates of clinical prostate cancer behavior, Cancer Cell, vol.1, issue.2, pp.203-209, 2002. ,
DOI : 10.1016/S1535-6108(02)00030-2
Feature selection for face recognition based on data partitioning, Object recognition supported by user interaction for service robots, pp.680-683, 2002. ,
DOI : 10.1109/ICPR.2002.1044845
Puces à adn, Recherche, vol.8, issue.9, p.7, 2001. ,
DNA Arrays methods and protocols, chapter DNA Microarrays, pp.1-15, 2001. ,
DNA Arrays: Methods and Protocols, chapter DNA Microarrays, pp.1-15, 2000. ,
Methods in microarray normalization, 2003. ,
DOI : 10.1201/9781420052794
Microarray bioinformatics, pp.88-109, 2003. ,
Ensemble machine learning on gene expression data for cancer classification, Theodoridis et Koutroumbas, pp.75-83, 1999. ,
Pattern Recognition, pp.40-41, 1995. ,
DOI : 10.1016/B0-12-227240-4/00132-5
Missing value estimation methods for DNA microarrays, Bioinformatics, vol.17, issue.6, pp.520-525, 1993. ,
DOI : 10.1093/bioinformatics/17.6.520
Robust feature selection algorithms, Proceedings of 1993 IEEE Conference on Tools with Al (TAI-93), pp.356-363, 1993. ,
DOI : 10.1109/TAI.1993.633981
Statistical learning theory, p.13, 1998. ,
Gene expression profiling predicts clinical outcome of breast cancer, Nature, vol.415, issue.6871, pp.530-536, 2002. ,
DOI : 10.1038/415530a
HykGene: a hybrid approach for selecting marker genes for phenotype classification using microarray gene expression data, Bioinformatics, vol.21, issue.8, pp.1530-1537, 2005. ,
DOI : 10.1093/bioinformatics/bti192
Neuro-Fuzzy Ensemble Approach for Microarray Cancer Gene Expression Data Analysis, 2006 International Symposium on Evolving Fuzzy Systems, pp.241-246, 2006. ,
DOI : 10.1109/ISEFS.2006.251144
Feature Extraction from Tumor Gene Expression Profiles Using DCT and DFT, EPIA Workshops, pp.485-496, 2007. ,
DOI : 10.1007/978-3-540-77002-2_41
The use of zero-norm with linear models and kernel methods, Journal of Machine Learning Research, vol.3, pp.1439-1461, 2002. ,
Top 10 algorithms in data mining, Knowledge and Information Systems, vol.9, issue.2, pp.1-37, 2008. ,
DOI : 10.1007/s10115-007-0114-2
Survey of Clustering Algorithms, IEEE Transactions on Neural Networks, vol.16, issue.3, pp.645-678, 2005. ,
DOI : 10.1109/TNN.2005.845141
Normalization for cDNA microarray data: a robust composite method addressing single and multiple slide systematic variation, Nucleic Acids Research, vol.30, issue.4, pp.1-12, 2002. ,
DOI : 10.1093/nar/30.4.e15
Generalized discriminant analysis for tumor classification with gene expression data, Machine Learning and Cybernetics, vol.1, pp.4322-4327, 2006. ,
Feature subset selection using a genetic algorithm, IEEE Intelligent Systems, vol.13, issue.2, pp.44-49, 1998. ,
DOI : 10.1109/5254.671091
Hybrid methods to select informative gene sets in microarray data classification, Australian Conference on Artificial Intelligence, pp.810-814, 2007. ,
Using uncorrelated discriminant analysis for tissue classification with gene expression data, IEEE/ACM Trans. Comput. Biology Bioinform, vol.1, issue.4, pp.181-190, 2004. ,
LDA/QR: an efficient and effective dimension reduction algorithm and its theoretical foundation, Pattern Recognition, vol.37, issue.4, pp.851-854, 2004. ,
DOI : 10.1016/j.patcog.2003.08.006
Efficient feature selection via analysis of relevance and redundancy, Journal of Machine Learning Research, vol.5, pp.1205-1224, 2004. ,
Redundancy based feature selection for microarray data, KDD, pp.737-742, 2004. ,
Informative Gene Selection and Tumor Classification by Null Space LDA for Microarray Data, ESCAPE, pp.435-446, 2007. ,
DOI : 10.1007/978-3-540-74450-4_39
Fuzzy sets, Information and Control, vol.8, issue.3, pp.338-353, 1965. ,
DOI : 10.1016/S0019-9958(65)90241-X
The concept of a linguistic variable and its application to approximate reasoning -i, Inf. Sci, vol.8, issue.108, pp.199-249, 1975. ,
An Effective Gene Selection Method Based on Relevance Analysis and Discernibility Matrix, PAKDDZhu et Hastie, pp.1088-1095, 2004. ,
DOI : 10.1007/978-3-540-71701-0_123
Classification of gene microarrays by penalized logistic regression, Biostatistics, vol.5, issue.3, pp.427-443, 2004. ,
DOI : 10.1093/biostatistics/kxg046
Fuzzy logic for elimination of redundant information of microarray data, Genomics Proteomics and Bioinformatics, vol.6, issue.2, 2008. ,
A Hybrid GA/SVM Approach for Gene Selection and Classification of Microarray Data, Conférences internationales avec comité de sélection 1, pp.34-44, 2006. ,
DOI : 10.1007/11732242_4
Gene Selection for Microarray Data by a LDA-Based Genetic Algorithm, Third IAPR International Conference on Pattern Recognition in Bioinformatics (PRIB'08), dans Lecture Notes in Bioinformatics, pp.250-261, 2008. ,
DOI : 10.1007/978-3-540-88436-1_22
Une méthode de pré-traitement et de pré-sélection par la logique floue pour les données de puces ADN, Conférences francophones avec actes de résumés étendus 1 Actes du Septième Congrès de la Société Française de Recherche Opérationnelle et d'Aide à la Décision (ROADEF'06), 2006. ,
Algorithme génétique et SVM pour la sélection et la classification de données des puces, Actes du Septième Congrès de la Société Française de Recherche Opérationnelle et d'Aide à la Décision (ROADEF'06), 2006. ,