R. Qu, a ce moment-ci, aucune nouvelle exécution ne va plus proposer de candidats car les noeuds s nl et s nr dans les triplets de RT States ont déjàdéjàété fusionnés par le processus de réduction

?. Etudier, Glushkov et ainsi, appliquer l'approche d'inférence grammaticale pour trouver les candidats ou le candidat idéal. Nous envisageons, dans ce cas, de changer l'algorithme RPNI pour qu'il préserve les propriétés de Glushkov pendant les pas de construction de l'automate cible : la fusion desétats desétats et la déterminisation de l'automate

?. Utiliser-notre-méthode-dans-le-même-cadre-que-celui-de-la-méthode-proposée-dans, BGMT02] (section 5.3) : adapter le schémas selon un nouveau document qui arrive dans la base de données. Pour cela, le document X ` a insérer dans la base de données XML est comparé avec les documents préexistants et, en utilisant le document X ? le plus proche de X, on construit une séquence de misesàmisesà jour sur X ? qui résulte X. Ensuite

?. Appliquer-la-méthode-dans-l, ensemble du schéma (non plus une seule expressionrégulì ere) : dans ce cas les motsàmotsà traiter seront représentés par des arbres. Dans ce contexte, l'impact du langage de schéma peutêtrepeutêtre très important

. [. Bibliographie, P. Abiteboul, D. Buneman, and . Suciu, Data on the Web -From Relations to Semistructured Data and XML, 2000.

[. Al-jadir and F. El-moukaddem, Once Upon a Time a DTD Evolved into Another DTD..., International Conference Object-Oriented Information Systems, 2003.
DOI : 10.1007/978-3-540-45242-3_3

]. H. Aho97 and . Ahonen, Disambiguation of SGML content models, PODP, 1997.

R. [. Abiteboul, V. Hull, and . Vianu, Foundations of Databases, 1995.

T. Amn-+-01-]-n.-alon, F. Milo, D. Neven, V. Suciu, and . Vianu, XML with data values: Typechecking revisited, ACM Symposium on Principles of Database System, 2001.

]. D. Ang82 and . Angluin, Inference of reversible languages, J. ACM, vol.29, issue.3, pp.741-765, 1982.

L. [. Berstel and . Boasson, XML Grammars, Mathematical Foundations of Computer Science, number 1893 in LNCS, pp.182-191, 2000.
DOI : 10.1007/3-540-44612-5_14

URL : https://hal.archives-ouvertes.fr/hal-00619885

G. [. Benzaken, A. Castagna, and . Frisch, CDuce, ACM SIGPLAN Notices, vol.38, issue.9, pp.51-63, 2003.
DOI : 10.1145/944746.944711

URL : https://hal.archives-ouvertes.fr/hal-00699610

S. [. Bidoit, V. Cerrito, and . Thion, A first step towards modelling semistructured data in hybrid multi-modal logic, Journal of Applied Non-Classical Logics, 2004.

. Bdh-+-04a-]-b, D. Bouchou, M. Duarte, D. Halfeld-ferrari-alves, M. A. Laurent et al., Learning from failure: Conservative extension of regular languages, International Conference of the Chilean Computer Science Society, number PR2200 in IEEE Proceedings, pp.99-109, 2004.

. Bdh-+-04b-]-b, D. Bouchou, M. Duarte, D. Halfeld-ferrari-alves, M. A. Laurent et al., Schema evolution for XML: A consistency-preserving approach, Mathematical Foundations of Computer Science, number 3153 in LNCS, pp.876-888, 2004.

]. V. Bdh04c, S. B. Braganholo, C. A. Davidson, and . Heuser, From XML view updates to relational view updates: old solutions to a new problem, VLDB, pp.276-287, 2004.

D. [. Bouchou, M. Duarte, D. Halfeld-ferrari-alves, and . Laurent, Extending tree automata to model XML validation under element and attribute constraints, ICEIS, 2003.

S. [. Buneman, G. Davidson, D. Hillebrand, and . Suciu, A query language and optimization techniques for unstructured data, ACM SIGMOD Record, vol.25, issue.2, pp.505-516, 1996.
DOI : 10.1145/235968.233368

G. [. Bertino, M. Guerrini, L. Mesiti, and . Tosetto, Evolving a set of DTDs according to a dynamic set of XML documents Updates and incremental validation of XML documents, XML-Based Data Management -EDBT, volume 2490 of Lecture Notes in Computer Science The 9th DBPL, number 2921, 2002.

M. G. Van-den-brand, J. Heering, P. Klint, P. A. Olivierbk93, and ]. Bruggeman-klein, Compiling rewrite systems: The ASF+SDF compiler Regular expressions into finite automata, Malhorta. XML Schema Part 2: Datatypes Second Edition, Recomendation W3C, pp.197-213, 1993.

D. Barbosa, A. O. Mendelzon, L. Libkin, L. Mignet, M. J. Arenas-[-bnb04-]-g et al., Efficient incremental validation of XML documents DTDs versus XML schema: a practical study, ICDE Proceedings of the 7th International Workshop on the Web and Databases, pp.671-682, 2004.

T. Bray, J. Paoli, C. M. Sperberg-mcqueen, E. Maler, A. Balmin et al., Extensible markup language (XML T M 1.0) http://www.w3.org/TR Incremental validation of XML documents, ACM Transactions on Database Systems, vol.29, issue.481, pp.710-751117, 1986.

A. Boukottaya, C. Vanoirbeek, F. Paganelli, O. A. Khaledbw98b, ]. Bruggeman-klein et al., Automating XML document transformations: A conceptual modelling based approach Deterministic regular languages Regular tree languages over non-ranked alphabets, First Asia-Pacific Conference on Conceptual Modelling (APCCM2004), volume 31 of CRPIT STACS, 1992. [BW98a] A. Bruggeman-Klein and D. Wood. One-unambiguous regular languages. Information and ComputationCDG + 97] H. Comon, M. Dauchet, R. Gilleron, F. Jacquemard, D. Lugiez, S. Tison, and M. Tommasi, pp.81-90182, 1998.

D. Calvanese, G. D. Giacomo, M. Lenzerini-[-cf03-]-p, M. Caron, D. Flouret et al., Representing and reasoning on XML documents: a description logic approach, Tree Automata Techniques and Applications. Available on Proc. IEEE Advances in Digital Libraries Conference International Workshop on Knowledge Representation meets Databases CEUR Workshop Proceedings. Technical University of Aachen (RWTH), 2001. [Chi02] Boris Chidlovskii. Schema extraction from xml collections. In JCDL '02: Proceedings of the 2nd ACM/IEEE-CS joint conference on Digital libraries, pp.295-318, 1997.
DOI : 10.1093/logcom/9.3.295

R. Leiserson, . [. Rivest, M. Clark, . Murata, . Relax et al., XSL transformation (XSLT) specification Introduction to Algorithms Type-based XML processing in logic programming Querying unranked trees with stepwise tree automata Axiomatization of the evolution of XML database schema From regular expression to DFA's using NFA's On validation of XML streams using finite state machines Challenge of XML schemas -schema evolution, Three models for the description of language. IRE Transactions on Information Theory WebDB PADL '03: Proceedings of the 5th International Symposium on Practical Aspects of Declarative Languages Rewriting Techniques and Applications: 15th International Conference Proceedings of the 3rd Annual Symposium on Combinatorial Pattern Matching, number 664 in Lecture Notes in Computer Science WebDB '04: Proceedings of the 7th International Workshop on the Web and Databases Proceedings of XML EuropeCZ00] P. Caron and D. Ziadi. Characterization of Glushkov automata Champarnaud, D. Ziadi, and J.-L. Ponty. Determinization of glushkov automata Third International Workshop on Implementing Automata -WIA'98DL03] S. Dal Zilio and D. Lugiez. XML schema, tree logic and sheaves automata RTA 2003 ? 14th International Conference on Rewriting Techniques and Applications, volume 2706 of Lecture Notes in Computer ScienceDM98] P. Dupont and L. Miclet. Inférence grammaticalerégulì ere : fondements théoriques et principaux algorithmes Institut National De Recherche en Informatique et en Automatique -INRIA -Rennes, pp.113-124, 1900.

L. [. Dupont, E. Miclet, and . Vidal, What is the search space of the regular inference?, ICGI '94: Proceedings of the Second International Colloquium on Grammatical Inference and Applications, pp.25-37, 1994.
DOI : 10.1007/3-540-58473-0_134

]. P. Dup96 and . Dupont, Incremental regular inference, International Colloquium on Grammatical Inference: Learning Syntax from Sentences, pp.222-237, 1996.

]. H. Fer01 and . Fernau, Learning XML grammars, MLDM '01: Proceedings of the Second International Workshop on Machine Learning and Data Mining in Pattern Recognition, pp.73-87, 2001.

M. [. Frick, C. Grohe, and . Koch, Query evaluation on compressed trees (extended abstract), 18th Annual IEEE Symposium on Logic in Computer Science -LICS, pp.188-197, 2003.

W. Fan and L. Libkin, On XML integrity constraints in the presence of DTDs, PODS '01: Proceedings of the twentieth ACM SIGMOD-SIGACT- SIGART symposium on Principles of database systems, pp.114-125, 2001.

J. [. Fernandez, P. Siméon, and . Wadler, XML query languages: Experiences and exemplars Available from http, 1999.

M. Garofalakis, A. Gionis, R. Rastogi, S. Seshadri, and K. Shim, XTRACT: a system for extracting document type descriptors from XML documents, SIGMOD '00: Proceedings of the 2000 ACM SIGMOD international conference on Management of data, pp.165-176, 2000.

]. E. Gol67 and . Gold, Language identification in the limit, Information and Control, vol.10, issue.5, pp.447-474, 1967.

]. C. Gol91 and . Goldfarb, The SGML Handbook, 1991.

J. [. Giammarresi, D. Ponty, D. Wood, and . Ziadi, Thompson Digraphs: A Characterization, Automata Implementation : 4th International Workshop on Implementing Automata, pp.91-100, 2001.
DOI : 10.1007/3-540-45526-4_9

J. [. Giammarresi, D. Ponty, D. Wood, and . Ziadi, A characterization of thompson digraphs, Discrete Appl. Math, vol.134, pp.1-3317, 2004.

M. [. Gécseg and . Steinby, Tree Languages, Handbook of Formal Languages, 1997.
DOI : 10.1007/978-3-642-59126-6_1

M. [. Hosoya and . Murata, Validation and boolean operations of attribute-element constraints, Programming Languages Technologies for XML, PLAN-X, 2002.

R. [. Hopcroft, J. D. Motwani, and . Ullman, Introduction to Automata Theory, Languages, and Computation, 2001.

B. [. Hosoya and . Pierce, XDuce, ACM Transactions on Internet Technology, vol.3, issue.2
DOI : 10.1145/767193.767195

A. [. Iacob, M. I. Dekhtyar, and . Dekhtyar, Checking potential validity of XML documents, Proceedings of the 7th International Workshop on the Web and Databases colocated with ACM SIGMOD/PODS 2004, WebDB '04, pp.91-96, 2004.
DOI : 10.1145/1017074.1017097

]. P. Kil99 and . Kilpelainen, SGML and XML content models, 1999.

]. S. Kle65, E. Kleene, P. Kuikka, M. Leinonen, . Penttonen-[-ksr02-]-b et al., Towards automating of document structure transformations Consistently updating XML documents using incremental constraint check queries XML: Model, schemas, types, logics, and queries Comparative analysis of six XML schema languages, Automata Studies ACM -Symposium on Document Engineering Logics for Emerging Applications of DatabasesLei03] P. Leinonen. Automating XML document structure transformations. In DocEng '03: Proceedings of the 2003 ACM symposium on Document engineering, pp.3-42, 1965.

D. Lee, M. Mani, M. Murataibm-almaden-research, S. Center, A. Maneth et al., Reasoning about XML schemas languages using formal language theory Available in www.cobase.cs.ucla.edu/tech-docs/? dongwon/ibm-tr-2000.ps XML type checking with macro tree transducer, PODS, 2005. [Meg00] D. Megginson. SAX 2.0: the Simple API for XML. Official Website for SAXMH03] M. Murata and H. Hosoya. Validation algorithm for attribute-element constraints of RELAX NG. In Extreme Markup Languages, 2000.

M. Murata, D. Lee, and M. Mani, Taxonomy of XML schema languages using formal language theory, Extreme Markup Language, 2001.
DOI : 10.1145/1111627.1111631

M. Murata, D. Lee, M. Mani, K. Kawaguchi-martens, F. Neven-[-msv00-]-t et al., To Appear Typechecking top-down uniform unranked tree transducers Typechecking for XML transformers Forest-regular languages and tree-regular languages Data model for document transformation and assembly Extensions of attribute grammars for structured document queries, Taxonomy of XML schema language using formal language theory Database Theory -ICDT 2003 ACM Symposium on Principles of Database System Unpublished manuscript PODDP '98: Proceedings of the 4th International Workshop on Principles of Digital Document Processing DBPL '99: Revised Papers from the 7th International Workshop on Database Programming LanguagesNev02a] F. Neven. Automata, logic and XML 11th Annual Conference of the EACSL Proceedings, volume 2471 of Lecture Notes in Computer Science, pp.11-22, 1995.

B. Neven, Automata theory for XML researchers, ACM SIGMOD Record, vol.31, issue.3, 2002.
DOI : 10.1145/601858.601869

R. [. Oncina and . Garcia, Inferring regular languages in polynomial update time, Pattern Recognition and Image Analysis, pp.49-61, 1992.

H. [. Papakonstantinou, J. Garcia-molina, and . Widom, Object exchange across heterogeneous information sources, Proceedings of the Eleventh International Conference on Data Engineering, pp.251-260, 1995.
DOI : 10.1109/ICDE.1995.380386

URL : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.47.5182

V. [. Parekh and . Honavar, Automata induction, grammar inference, and language acquisition, Handbook of Natural Language Processing, 2000.

V. [. Papakonstantinou and . Vianu, DTD inference for views of XML data, Proceedings of the nineteenth ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems , PODS '00, pp.35-46, 2000.
DOI : 10.1145/335168.335173

V. [. Papakonstantinou and . Vianu, Incremental Validation of XML Documents, International Conference on Database Theory -ICDT, 2003.
DOI : 10.1007/3-540-36285-1_4

L. J. Roddick, L. Al-jadir, M. Bertossi, F. Dumas, H. Estrella et al., Evolution and change in data management --- issues and directions, ACM SIGMOD Record, vol.29, issue.1, pp.21-25, 2000.
DOI : 10.1145/344788.344789

P. [. Rahm and . Bernstein, A survey of approaches to automatic schema matching, The VLDB Journal, vol.10, issue.4, pp.334-350, 2001.
DOI : 10.1007/s007780100057

]. C. Roi99 and . Roisin, Documents multimédia structurés. habilitationàhabilitationà diriger des recherches, 1999.

J. [. Sur, J. Hammer, and . Siméon, An XQuery-based language for processing updates in XML, PLAN-X, 2004.

]. H. Skc-+-01, D. Su, L. Kramer, K. T. Chen, E. A. Claypool et al., XEM: Managing the evolution of XML documents, Eleventh International Workshop on Research Issues in Data Engineering on Document Management for Data Intensive Business and Scientific Applications, pp.103-110, 2001.

H. [. Su, E. A. Kuno, and . Rundensteiner, Automating the transformation of XML documents, Proceeding of the third international workshop on Web information and data management , WIDM '01, 2001.
DOI : 10.1145/502932.502946

]. D. Suc98 and . Suciu, Semistructured data and XML, Proceedings of International Conference on Foundations of Data Organization, 1998.

]. D. Suc01 and . Suciu, On database theory and XML, SIGMOD Record, vol.30, issue.3, 2001.

]. D. Suc02a and . Suciu, Typechecking for semistructured data, LNCS, vol.2397, 2002.

]. D. Suc02b and . Suciu, The XML typechecking problem, SIGMOD Rec, vol.31, issue.1, pp.89-96, 2002.

V. [. Segoufin and . Vianu, Validating streaming XML documents, Proceedings of the twenty-first ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems , PODS '02, 2002.
DOI : 10.1145/543613.543622

URL : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.7.6403

D. [. Thompson, M. Beech, N. Maloney, and . Mendelsohn, XML Schema Part 1: Structures Second Edition, Recomendation W3C, Handbook of Formal Languages, 1997.

]. W. Tic84 and . Tichy, The string-to-string correction problem with block moves, ACM Trans. Comput. Syst, vol.2, issue.4, pp.309-321, 1984.

Z. [. Tatarinov, A. Y. Ives, D. S. Halevy, and . Weld, Updating XML, ACM SIGMOD Record, vol.30, issue.2, pp.413-424, 2001.
DOI : 10.1145/376284.375720

A. [. Ullman, D. S. Aho, and . Hirschberg, Bounds on the Complexity of the Longest Common Subsequence Problem, Journal of the ACM, vol.23, issue.1, pp.1-12, 1976.
DOI : 10.1145/321921.321922

]. L. Val84 and . Valiant, A theory of the learnable, Communications of the ACM, vol.27, issue.11, pp.1134-1142, 1984.

]. V. Via01 and . Vianu, A web odyssey: from Codd to XML, ACM Symposium on Principles of Database System, 2001.

]. V. Via03 and . Vianu, XML: From practice to theory, Simpósio Brasileiro de Banco de Dados, 2003.

M. [. Wagner and . Fischer, The String-to-String Correction Problem, Journal of the ACM, vol.21, issue.1, pp.168-173, 1974.
DOI : 10.1145/321796.321811

]. L. Wha-+-00, A. Wood, V. Le-hors, S. Apparao, M. Byrne et al., Document Object Model (DOM) Level 1 Specification, W3C Recommendation, 1998.

J. [. Ziadi, J. Ponty, and . Champarnaud, Passage d'une expression rationnellèrationnellè a un automate fini non-déterministe, Bulletin of the Belgian Mathematical Society, pp.177-203, 1997.

. Une-feuille, (ii) un noeud qui représente unélémentunélément dont le modèle de contenu est EM P T Y sans attributs obligatoires ?) ou (iii) unélémentunélément dont le modèle de contenu accepte le mot vide et qui n'a pas d'attributs obligatoires attachés, i.e., ? ? P (a) et R comp (a) = ?, respectivement. Pour le premier cas, A associe l'´ etat q data au noeud. Pour le second ettroisì eme cas A associe l'´ etat q a au noeud car le noeud de l'arbre a l'´ etiquette a, selon P (a) et R(a), respectivement. Dans la définition 7.2.1, la r` egle de transition est soit a, ) = h(E) (? ? L(E)) et R comp = ?

. Un-noeud-interne, Soit {a 0 , . . . , a i?1 } (0 ? i < n) desétiquettesdesétiquettes dans les positions pj (j < i) telles que {a 0 , . . . , a i?1 } ? R(a) Soit {a i , . . . , a n?1 } desétiquettesdesétiquettes dans les positions pj (j < n) telles que a i . . . a n?1 ? P (a) Nous supposons que les fils a 0 . . . a (n?1) de a ont déjà déjàété associés auxétatsauxétats q a 0 . . . q a (n?1) comme hypothèse inductive

. Donc, nous avons : ? Par l'hypothèse inductive, l'item 4 est respecté

?. Si-la-séquence-a-i, a (n?1) est vide, alors M P (a) accepte le mot vide et

. Et-ainsi, nous avons prouvé que pour chaque arbre dérivé t de d il existe une exécution compì ete et réussie de A sur t

<. ?. , ?. >. , ?. ?. Data-ou-a, <. ?. , >. et al., A associe q data ou q a en utilisant la r` egle de transition data, avec le mot vide dans L(E), respectivement. Dans d nous savons que p est construite soit par P (a) = data et R(a) = ? sur le p` ere de p soit sur p lui-même par P (a) et R comp (a) = ? tel que ? ? L(P (a))

<. ?. , ?. >. , ?. ?. Data, <. ?. , >. et al., R(a) = ?, en utilisant le morphisme h et la définition 7.2.1, correspondentàcorrespondentà data, Nous savons alors

. En-appliquant-le-morphisme-h-et-la, q a i?1 } et S mandatory ? {q a 0, q a i?1 } \ S mandatory ? S optional, n?1 ? L(E). Ainsi, l'item g.2 est respecté

. Et-ainsi, nous avons prouvé que pour chaque t accepté par A, t est dérivé de d, i

. Dans-le-cadre-d, une suppression, nous savons que la définition 8.4.7 rend le s new optionnel

S. M. Alors and M. Est-construitàconstruità-partir-de, en suivant les cas présentés ci-dessus, M E i accepte tous les mots acceptés par M E . En effet, s new est soit inséré comme unétatunétat optionnel, soit comme unétat unétat disjoint, soit il est transformé en optionnel. Comme M E i est utilisé pour accepter le langage décrit par E i

E. Nous-prouvons-que-la-distance-entre-une-candidate and . Et-l-'expressionrégulì-ere-d, origine E estégaì estégaì a 1 en se servant de la définition 8.4.1. Dans un graphe de Glushkov, chaque noeud (´ etat) correspondàcorrespondà un symbole dans l'expressionrégulì ere d'origine (hormis l'´ etat initial), si GREC insère un nouveí etat dans un graphe de Glushkov G et si le nouveau graphe G ? est encore réductible (théorème 8.5.1), alors la transformation de G ? en une expressionrégulì ere E ? produit une expressionrégulì ere avec un symbole en plus par rapportàrapportà l'expressionrégulì ere produite par G) = 1 . En appliquant le même raisonnement dans le cadre de suppression, GREC, lors de la construction du nouveau graphe G ? ` a partir de G, ne fait aucune insertion ou suppression de noeud. Ainsi, si le nouveau graphe a les mêmes noeuds que G, alors l'expression régulì ere construitè a

. Et-ainsi, nous avons prouvé prouvons que l'ensemble d'expressionsrégulì eres S E ? construit par GREC est fini et non vide De plus, le langage de chaque candidat inclut le langage de l'expression régulì ere d'origine et le nouveau mot

L. 'exécution-de-grec-e-(-g-wo and H. States, ST rans) retourne un ensemble fini et non vide d'expressionsrégulì eres candidates {E 1 , . . . , E m }. De plus, pour tout E i ? {E 1, E m }, nous avons L(E) ? {w ? } ? L(E i ) et D(E, E i ) ? k

. Pour-la-preuve-que-l-'ensemble-construit-par-grec-e-est-fini, non-vide et correct, on se sert de la démonstration du théorème 8.5.2. On ajoute, pour la correction, le fait que plusieurs triplets s nl , s nr , s new sont utilisés pour construire un graphe et il se peut que l'une des définitions appliquées sur un triplet soit contradictoire avec une autre définition appliquée sur un autre triplet. On part de l'affirmation que toutes les candidates E i doivent respecter : L(E) ? {w ? } ? L(E i ), en d'autres termes, le langage décrit par E i doit inclure le langage décrit par l'expressionrégulì ere d'origine E et le mot w ? qui n

S. Ainsi and . Pour, tous les s new insérés dans un graphe, la fonction LookForGraphAlternative-e vérifie si la paire (a, e) est respectée alors les automates construitsàconstruitsà partir de candidats auront la transition correspondante et donc, le mot w ? est accepté par l'automate, Pour vérifier si L(E) ? L(E i ), on utilise le même raisonnement que pour le théorème 8.5.2 : les définitions ajoutent des arcs mais n'en suppriment pas, donc tout mot de L(E) est aussi dans L(E i )

. Dans-la-suite, nous prouvons que la distance entre une candidate E ? et l'expressionrégulì ere E est inférieure oú egaì a k en se servant de la définition 8.4.1. Dans un graphe de Glushkov, chaque noeud (´ etat) correspondàcorrespondà un symbole dans l'expressionrégulì ere d'origine (hormis l'´ etat initial)

G. Si, G. -e-insère-k-nouveauxétatsnouveauxétats-dans-un-graphe-de-glushkov, G. Si-le-nouveau-graphe, and . Est-encore-réductible, ), alors la transformation de G ? en une expressionrégulì ere E ? produit une expressionrégulì ere avec k symboles en plus par rapportàrapportà l'expressionrégulì ere