.. Comparaison-de-méthodes-d-'alignement, 72 3.6.1 Caractéristiques globales

. Dans-le-domaine-de-l, alignement de schémas de bases de données, la prise en compte de correspondances complexes entre attributs a ´ etéetéétudiéè a plusieurs reprises [DH05] Une correspondance complexe est une expression de la forme a 1 op 1 a2op 2 ...a n = b 1 op ? 1

. Dans-le-domaine-de, Un des seuls travaux allant dans ce sens a ´ eté celui de A. Doan [DMD + 03], qui s'est restreint d'une part, aux disjonctions de concepts, les correspondances complexes ontétéontété très peú etudiées

. Suivant-ce-principe, Afin d'atteindre ce but, on devrait tout d'abord s'intéresserintéresserà l'implication de l'utilisateur dans le choix des pré-traitements et des méthodes d'alignementàalignementà utiliser . Quelques approches flexibles de ce genre ontétéontété proposées dans le cadre de l'alignement d'ontologies et de schémas (COMA [DR02] et son extension COMA++ [ADMR05]). L'autre aspect qui devraitêtredevraitêtre davantagé etudié est celui de l'explication des alignements produits. En effet, des efforts doiventêtredoiventêtre faits pour assurer une explication intelligible des résultats pour l'utilisateur afin qu'il puisse mieux comprendre pourquoi une relation a ´ eté détectée. Enfin, un dernier aspect concerne la visualisation des alignements qui est rendue très souvent problématique de par la taille des structures. Pour cela, deux approches sont envisageables

. [. Bibliographie, H. Aumueller, S. Do, and . Massmann, Rahm ? ?? Schema and ontology matching with coma++ ??, Proceedings of the 2005 ACM SIGMOD international conference on Management of data (SIGMOD 05), pp.906-908, 2005.

A. R. Agrawal and T. , Aimé ? ?? Visualisation interactive d'alignements implicatifs entre hiérarchies conceptuelles ?? Mémoire d'ingénieur -CNAM Nantes Imielinski et A. Swami ? ?? Mining association rules between sets of items in large databases ??, Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data, pp.207-216, 1993.

. [. Agrawal, Srikant ? ?? Fast algorithms for mining association rules in large databases ??, Proceedings of 20th International Conference on Very Large Data Bases (VLDB 94) (J. B. Bocca, M. Jarke et C. Zaniolo, pp.487-499, 1994.

. [. Agrawal, Srikant ? ?? On integrating catalogs ??, Proceedings of the 10th international conference on World Wide Web (WWW 01), pp.603-612, 2001.

P. [. Aggarwal, Mining associations with the collective strength approach, IEEE Transactions on Knowledge and Data Engineering, vol.13, issue.6, pp.863-873, 2001.
DOI : 10.1109/69.971183

R. Bach and F. Dieng-kuntz, Bach ? ?? Construction d'un web sémantique multi-points de vue ?? Gandon ? ?? On ontology matching problems (for building a corporate semantic web in a multi-communities organization) ??, Proceedings of the 6th International Conference on Enterprise Information Systems (ICEIS 2004) (Porto (PT)), pp.236-243, 2004.

. [. Bibliographie, M. Blanchard, and . Harzallah, Kuntz ? ?? Vers une classification des similarités basées sur le contenu informationnel des concepts d'une hiérarchie de subsomption ??, Actes des 18èmes journées francophones sur l'Ingénierie des Connaissances Cépadues, pp.145-156, 2007.

[. Lee and J. , Hendler et O. Lassila ? ?? The Semantic Web ??, Scientific American, vol.284, issue.5, pp.34-43, 2001.

P. [. Blanchard, M. Kuntz, and . Harzallah, Briand ? ?? A tree-based similarity for evaluating concept proximities in an ontology ??, Proceedings of the 10th conference of the International Federation of Classification Societies, pp.3-11, 2006.

H. [. Brachman, Levesque ? Knowledge representation and reasoning ? ?? Un système de visualisation pour l'extraction, l'´ evaluation, et l'exploration interactives des r` egles d'association ??, Thèse, Lenzerini et S. Navathe ? ?? A comparative analysis of methodologies for database schema integration ??, pp.323-364, 1986.

R. [. Brin and C. Motwani, Beyond market baskets, ACM SIGMOD Record, vol.26, issue.2, pp.265-276, 1997.
DOI : 10.1145/253262.253327

R. [. Brin and J. Motwani, Dynamic itemset counting and implication rules for market basket data, ACM SIGMOD Record, vol.26, issue.2, pp.255-264, 1997.
DOI : 10.1145/253262.253325

]. D. Bou94, ?. Bourigault, H. ??-lexter, M. Briand, R. Sebag et al., extraction de terminologie . applicationàapplicationà l'acquisition des connaissancesàconnaissancesà partir des textes, Thèse, Ecole des Hautes Etudes en Sciences sociales Mesures de qualité pour la fouille de données,Cépadù es Editions numéro spécial de la Revue des Nouvelles Technologies de l'Information. [CAdV01] S. Castano, V. D. Antonellis et S. D. C. di Vimercati ? ?? Global viewing of heterogeneous data sources ??, pp.277-297, 1994.

A. [. Castano and S. Ferrara, Montanelli ? ?? Matching ontologies in open networked systems : Techniques and applications ??, Journal on Data Semantics (JoDS), vol.5, pp.25-63, 2005.

. [. Caillez, A contribution to the study of the metric and Euclidean structures of dissimilarities, Psychometrika, vol.3, issue.3, pp.241-253, 1996.
DOI : 10.1007/BF02294337

J. [. Ceglar, Association mining, ACM Computing Surveys, vol.38, issue.2, p.5, 2006.
DOI : 10.1145/1132956.1132958

P. [. Cohen, Ravikumar et S. Fienberg ? ?? A comparison of string metrics for matching names and records ??, Proceedings of the IJCAI-2003 Workshop on Information Integration on the Web (IIWeb 03), pp.73-78, 2003.

F. [. David and H. Guillet, Briand ? ?? Matching directories and owl ontologies with aroma ??, Proceedings of the 15th ACM international conference on Information and knowledge management (CIKM 06), pp.830-831, 2006.
DOI : 10.1145/1183614.1183752

URL : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.324.477

]. J. Dgb07a, F. David, and H. Guillet, Briand ? ?? Association rule ontology matching approach ??, International Journal on Semantic Web and Information Systems, vol.3, issue.2, pp.27-49, 2007.

]. J. Dggb06a, F. David, R. Guillet, and . Gras, Briand ? ?? Alignement de hiérarchies conceptuelles par découverte d'implications entre concepts ??, Revue des Nouvelles Technologies de l, pp.151-162, 2006.

]. J. Dgp-+-05a, F. David, V. Guillet, and H. Philippé, Briand et R. Gras ? ?? Validation d'une expertise textuelle basée sur l'intensité d'implication ??, Atelier DKQ de la conférence Extraction et Gestion des Connaissances 2005, 2005.

]. J. Bibliographie-[-dgp-+-05b, F. David, V. Guillet, R. Philippé, H. Gras et al., Briand ? ?? Validation d'une expertise textuelle par une méthode de classification basée sur l'intensité d'implication ??, Actes des Rencontres Analyse Statistique Implicative, pp.157-162, 2005.

F. [. David and V. Guillet, Philippé et R. Gras ? ?? Implicative statistical analysis applied to clustering of terms taken from a psychological text corpus ??, Proceedings of the 11th symposium on Applied Stochastic Models and Data Analysis (ASMDA 05), pp.201-208, 2005.

A. [. Doan, Halevy ? ?? Semantic-integration research in the database community ??, AI Magazine, vol.26, issue.1, pp.83-94, 2005.

]. A. Dmd-+-03, J. Doan, R. Madhavan, and P. Dhamankar, Domingos et A. Halevy ? ?? Learning to match ontologies on the semantic web ??, The VLDB Journal, vol.12, issue.4, pp.303-319, 2003.

J. [. Doan, P. Madhavan, and . Domingos, Halevy ? ?? Learning to map between ontologies on the semantic web ??, Proceedings of the 11th international conference on World Wide Web (WWW 02), pp.662-673, 2002.

J. [. Doan, P. Madhavan, and . Domingos, Halevy ? ?? Ontology matching : a machine learning approach ??, Handbook on Ontologies in Information Systems, pp.397-416, 2004.

. [. Do, Rahm ? ?? Coma -a system for flexible combination of schema matching approaches ??, Proceedings of the 28th International Conference on Very Large Data Bases (VLDB 02), pp.610-621, 2002.

M. Ehrig, Euzenat ? ?? Relaxed precision and recall for ontology matching ??, Proceedings of the Workshop on Integrating Ontologies, pp.25-32, 2005.

. [. Euzenat, Shvaiko ? Ontology matching, p.2007

G. [. Frawley and C. J. Piatetsky-shapiro, Matheus ? ?? Knowledge discovery in databases : An overview ??, Knowledge Discovery in Databases, pp.1-30, 1991.

G. [. Fayyad and P. Piatetsky-shapiro, Smyth ? ?? From data mining to knowledge discovery : An overview ??, Advances in Knowledge Discovery and Data Mining, pp.1-34, 1996.

R. Gras, R. Couturier, J. Blanchard, H. Briand, P. Kuntz et al., Peter ? ?? Quelques critères pour une mesure de qualité de r` egles d'association ??, Revue des Nouvelles Technologies de l, pp.3-31, 2004.

R. Gras, J. David, J. Régnier, F. Guillet, ?. A. ??-[-gf98-]-d et al., Typicalité et contribution des sujets et des variables supplémentaires en analyse statistique implicative ??, Revue des Nouvelles Technologies de l Actes de la Conférence EGC 06 Frieder ? Information retrieval : Algorithms and heuristics, ? Quality measures in data mining (studies in computational intelligence)Gra96] R. Gras et al. ? L'implication statistique, une nouvelle méthode exploratoire de données, pp.151-162, 1993.

P. [. Giunchiglia and . Shvaiko, Yatskevich ? ?? S-match : an algorithm and an implementation of semantic matching ??, Proceedings of European Semantic Web Symposium, pp.61-75, 2004.

]. W. Hayqw05, N. J. Hu, Y. Z. Qu, Y. Wang, and ?. Gmo, A graph matching for ontologies ??, Cap 2005 Workshop on Integrating Ontologies, pp.43-50, 2005.

Y. [. Han, Fu ? ?? Mining multiple-level association rules in large databases ??, IEEE Transactions on Knowledge and Data Engineering, vol.11, issue.5, pp.798-805, 1999.

C. [. Hayes, Gutiérrez ? ?? Bipartite graphs as intermediate model for rdf ??, Proceedings of the 3rd International Semantic Web Conference (ISWC 04), pp.47-61, 2004.

. [. Hilderman, Hamilton ? Knowledge discovery and measures of interestingness, 2001.

Y. [. Hoshiai, D. Yamane, and H. Nakamura, Tsuda ? ?? A semantic category matching approach to ontologies alignment ??, Proceedings of the 3rd international workshop on Evaluation of Ontology Based Tools, 2004.

. [. Kalfoglou, Ontology mapping: the state of the art, The Knowledge Engineering Review, vol.18, issue.1, pp.1-31, 2003.
DOI : 10.1017/S0269888903000651

]. S. Kul27, ?. Kulczynski, and ?. ??-die-pflanzenassoziationen-der-pieninen, Bulletin International de l'Académie Polonaise des Sciences et des Lettres, Classe des Sciences Mathématiques et Naturelles B, pp.57-203, 1927.

G. [. Kotis and . Vouros, Towards automatic merging of domain ontologies: The HCONE-merge approach, Web Semantics: Science, Services and Agents on the World Wide Web, vol.4, issue.1, pp.60-79, 2006.
DOI : 10.1016/j.websem.2005.09.004

]. V. Lev66, Levenshtein ? ?? Binary codes capable of correcting deletions , insertions, and reversals ??, Soviet Physics Doklady, vol.10, pp.707-710, 1966.

P. [. Lavrac and . Flach, Zupan ? ?? Rule evaluation measures : a unifying view ??, Proceedings of the ninth International Workshop on Inductive Logic Programming (ILP 99), pp.174-185, 1999.

. [. Lacher, Groh ? ?? Facilitating the exchange of explicit knowledge through ontology mappings ??, Proceedings of the 14th International Florida Artificial Intelligence Research Society Conference, pp.305-309, 2001.

. [. Lallich, Teytaud ? ?? Evaluation et validation de l'intérêt des r` egles d'association ??, pp.193-218, 2004.

P. [. Madhavan and E. Bernstein, Rahm ? ?? Generic schema matching with cupid ??, Proceedings of the 27th International Conference on Very Large Data Bases (VLDB 01), pp.49-58, 2001.

]. B. Mcb02, ?. Mcbride, and . Jena, A semantic web toolkit ??, IEEE Internet Computing, vol.06, issue.6, pp.55-59, 2002.

J. [. Minnen and . Carroll, Pearce ? ?? Applied morphological processing of english ??, Natural Language Engineering, vol.7, issue.3, pp.207-223, 2001.

H. [. Melnik and E. Garcia-molina, Rahm ? ?? Similarity flooding : A versatile graph matching algorithm and its application to schema matching ??, Proceedings of the 18th International Conference on Data Engineering (ICDE 02), pp.117-128, 2002.

M. [. Marcus and . Marcinkiewicz, Santorini ? ?? Building a large annotated corpus of english : the penn treebank ??, Computational Linguistics, vol.19, issue.2, pp.313-330, 1993.

[. Bibliographie, Mäedche et V. Zacharias ? ?? Clustering ontology-based metadata in the semantic web ??, the proccedings of the 6th European Conference on Principles and Practice of Knowledge Discovery in Databases (PKDD 02), pp.348-360, 2002.

M. [. Noy, The PROMPT suite: interactive tools for ontology merging and mapping, Workshop on Ontologies and Information Sharing at the Seventeenth International Joint Conference on Artificial Intelligence (IJCAI 01), pp.983-1024, 2001.
DOI : 10.1016/j.ijhcs.2003.08.002

. [. Nottelmann, Straccia ? ?? A probabilistic, logic-based framework for automated web directory alignment ??, Soft Computing in Ontologies and the Semantic Web, Studies in Fuzziness and Soft Computing, pp.47-77, 2006.

C. [. Needleman, A general method applicable to the search for similarities in the amino acid sequence of two proteins, Journal of Molecular Biology, vol.48, issue.3, pp.443-453, 1970.
DOI : 10.1016/0022-2836(70)90057-4

]. K. Pea96, ?. Pearson, and . ??, Mathematical contributions to the theory of evolution : regression, heredity and panmixia ??, Philosophical Transactions of the Royal Society Of London series A, issue.187, pp.253-318, 1896.

. [. Pantel, Lin ? ?? Discovering word senses from text ??, Proceedings of the 8th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD 02), pp.613-619, 2002.
DOI : 10.1145/775107.775138

URL : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.12.6771

W. [. Piatetsky-shapiro and . Frawley, Piatetsky-Shapiro ? ?? Discovery, analysis, and presentation of strong rules ??, Knowledge Discovery in Databases, AAAI, pp.229-248, 1991.

D. [. Palopoli and . Saccá, Ursino ? ?? An automatic technique for detecting type conflicts in database schemes ??, Proceedings of the 17th international conference on Information and knowledge management (CIKM 98), pp.306-313, 1998.

. Ptb-+-05-]-n, R. Pasquier, Y. Taouil, and G. Bastide, Stumme et L. Lakhal ? ?? Generating a condensed representation for association rules ??, Journal of Intelligent Information Systems, vol.24, issue.1, pp.29-60, 2005.

G. [. Palopoli, Experiences using DIKE, a system for supporting cooperative information system and data warehouse design, Hu et G. Chen ? ?? Constructing virtual documents for ontology matching ??, Proceedings of the 15th International World Wide Web Conference (WWW 06), pp.835-865, 2003.
DOI : 10.1016/S0306-4379(02)00101-1

P. [. Rahm, A survey of approaches to automatic schema matching, The VLDB Journal, vol.10, issue.4, pp.334-350, 2001.
DOI : 10.1007/s007780100057

H. [. Rada, E. Mili, and . Bicknell, Blettner ? ?? Development and application of a metric on semantic nets ??, IEEE Transactions on Systems, Man, and Cybernetics, vol.1, issue.19, pp.17-30, 1989.

[. Russel, Rao ? ?? On habitat and association of species of anopheline larvae in south-eastern madras ??, Journal of the Malaria Institute of India, vol.3, pp.153-178, 1940.

B. [. Reynaud, Safar et H. Kefi ? ?? Structural techniques for alignment of structurally dissymmetric taxonomies ??, Proceedings of the 15th International Conference on Knowledge Engineering and Knowledge Management (EKAW 06) (H. S. Pinto et M. Labsky, pp.39-40, 2006.

. [. Rogers, A Computer Program for Classifying Plants, Science, vol.132, issue.3434, pp.1115-1118, 1960.
DOI : 10.1126/science.132.3434.1115

. [. Srikant, Agrawal ? ?? Mining generalized association rules ??, Proceedings of the 21st International Conference on Very Large Databases (VLDB 95), pp.407-419, 1995.
DOI : 10.1016/s0167-739x(97)00019-8

URL : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.40.7602

. [. Srikant, Mining generalized association rules, Future Generation Computer Systems, vol.13, issue.2-3, pp.161-180, 1997.
DOI : 10.1016/S0167-739X(97)00019-8

URL : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.40.7602

. [. Shvaiko, Euzenat ? ?? A survey of schema-based matching approaches ??, Journal on Data Semantics LNCS, vol.4, issue.3730, pp.146-171, 2005.

C. [. Sokal, Michener ? ?? A statistical method for evaluating systematic relationships ??, University of Kansas Science Bulletin, vol.38, pp.1409-1438, 1958.

. Bibliographie, . Sms-+-01-]-n, A. Stojanovic, S. Maedche, R. Staab et al., Sure ? ?? Seal : a framework for developing semantic portals ??, Proceedings of the 1st international conference on Knowledge capture (K-CAP 01), pp.155-162, 2001.

. [. Sebag, Schoenauer ? ?? Generation of rules with certainty and confidence factors from incomplete and incoherent learning bases ??, Proceedings of the European knowledge acquisition workshop Gesellschaft f ? A?r Mathematik und Datenverarbeitung mbH, pp.28-29, 1988.

R. [. Straccia, ?. Troncy, and . ??, oMAP: Combining Classifiers for Aligning Automatically OWL Ontologies, Proceedings of the 6th International Conference on Web Information Systems Engineering (WISE 2005), pp.133-147, 2005.
DOI : 10.1007/11581062_11

M. [. Smith, Identification of common molecular subsequences, Journal of Molecular Biology, vol.147, issue.1, pp.195-197, 1981.
DOI : 10.1016/0022-2836(81)90087-5

A. [. Salton and C. S. Wong, A vector space model for automatic indexing, Communications of the ACM, vol.18, issue.11, pp.613-620, 1975.
DOI : 10.1145/361219.361220

D. [. Toutanova, C. D. Klein, and . Manning, Singer ? ?? Feature-rich part-of-speech tagging with a cyclic dependency network ??, Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology (NAACL 03), pp.173-180, 2003.

V. [. Tan and J. Kumar, Selecting the right objective measure for association analysis, Information Systems, vol.29, issue.4, pp.293-313, 2004.
DOI : 10.1016/S0306-4379(03)00072-3

]. J. Tll-+-06, J. Tang, B. Li, X. Liang, Y. Huang et al., Wang ? ?? Using bayesian decision for ontology mapping ??, Journal of Web Semantics, vol.4, issue.1, pp.243-262, 2006.

C. [. Toutanova, Manning ? ?? Enriching the knowledge sources used in a maximum entropy part-of-speech tagger ??, Proceedings of the 2000 Joint SIGDAT conference on Empirical methods in natural language processing and very large corpora, pp.63-70, 2000.

[. ??, Extensible markup language (xml) 1.0 (w3c recommendation ), 1988.

[. ??-rdf-primer, ? ?? The state of record linkage and current research problems ??, Statistical Research Division, U.S. Bureau of the Census, 1999.

M. [. Wu, Palmer ? ?? Verb semantics and lexical selection ??, Proceedings of the 32nd annual meeting of the associations for Computational Linguistics, pp.133-138, 1994.
DOI : 10.3115/981732.981751

L. Dans-la-littérature and . Plupart, des travaux traitant des méthodes d'alignement d'ontologies ou de schémas s'appuient sur une définition intentionnelle des schémas et utilisent des relations basées sur des mesures de similarité qui ont la particularité d'? etre symétriques (´ equivalences) Afin d'améliorer les méthodes d'alignement, et en nous inspirant des travaux sur la découverte de r` egles d'association, des mesures de qualité associées, et sur l'analyse statistique implicative

. Ainsi, une méthode d'alignement extensionnelle et orientée basée sur la découverte des implications significatives entre deux hiérarchies plantées dans un corpus textuel. Notre méthode d'alignement se décompose en trois phases successives. La phase de prétraitement permet de préparer les ontologiesàontologies`ontologiesà l'alignement en les redéfinissant sur un ensemble commun de termes extraits des textes et sélectionnés statistiquement. La phase de fouille extrait un alignement implicatif entre hiérarchies

L. Principaux-apports-de-cette-thèse-sont, Une modélisation de l'alignementétenduealignementétendue pour la prise en compte de l'implication. Nous définissons les notions de fermeture et couverture d'un alignement permettant de formaliser la redondance et la consistance d'un alignement. NousétudionségalementNousétudionsNousétudionségalement la symétricité et les cardinalités d'un alignement. (2) La réalisation de la méthode AROMA et d'une interface d'aidè a la validation d'alignements. (3) Une extension d'un modèle d'´ evaluation sémantique pour la prise en compte de la présence d'implications dans un alignement, ) L'´ etude du comportement et de la performance d'AROMA sur différents types de jeux de tests (annuaires Web, catalogues et ontologies au format OWL) avec une sélection de six mesures de qualité

. Alignement-d-'ontologies, Ingénierie des Connaissances, Extraction des Connaissances dans les bases de Données, fouille de données, r` egle d'association, Web Sémantique