, UN LEXIQUE BILINGUE un enrichissement de l'ontologie pour articuler les nouvelles unités lexicales pivot et satellites

, Dans les tests que nous avons effectués, les textes du domaine ont été les arbitres de l'enrichis

, Des essais en vraie grandeur du dispositif de consultation et d'enrichissement sont nécessaires, avec la mise en oeuvre informatisée des logiciels utilisés « à la main » dans notre travail et une interface appropriée sur un portail internet testé par des utilisateurs et des contributeurs. Nous entrons là dans le domaine du projet LEXEAU®. Nous espérons qu'il permettra d'associer des linguistes intéressés par des recherches liées à des applications opérationnelles à la réalisation d'un projet pilote, confié à un groupe de projet, Les tests effectués ont permis de développer un modèle robuste de réalisation d'un lexique stratifié du domaine de l'eau

A. Au and L. , Les annexes sont présentées dans une version provisoire au 15/12/2018, très incomplète. Elles devraient être finalisées avant la présentation de la thèse

A. 1. De-définition-d, UNITÉS LEXICALES Figure A.4 -Définition des prélèvements d'eau selon l'OCDE

A. 1. De-définition-d'unités and . Lexicales,

, Les figures B.1 et B.2 sont des copies d

B. Figure, 1 -Étiquettes morphosyntaxiques de l'anglais (début)

. .. Un-lexique-stratifié,

, Une partition de la base de connaissance

, 3.1 « Données » et « propriétés » dans l'ontologie du domaine, p.14

U. Essai-d'intégration-de-données-externes and .. .. ,

. .. De-l'ontologie,

. .. Acronymes,

, 32 1.8.1 Des définitions et de gloses pour les unités lexicales pivot

, Les fondements du projet LEXEAU®, vol.39

.. .. Le,

. .. Une-linguistique-de-corpus, 41 2.2.1 Documents, textes documentés et corpus textuels

. .. La-textométrie, 46 2.3.1 Dénombrer les « réalisations » d'une unité linguistique

. .. Trois-exemples-de-corpus, 63 2.4.1 Un petit corpus sur le thème de l'eau et l'éthique, p.68

.. .. Élaborer-un-lexique-de-base, 5.2 Des noms propres et des substantifs pour le lexique, p.71

. .. Une-mise-À-jour-lexicale-et-conceptuelle, 86 2.6.1 Des définitions adaptées au domaine de connaissance, p.88

, Des syntagmes et des cooccurrences 91

. .. , 91 3.1.1 Suites de deux noms, Extraction et sélection primaire des suites de noms

. .. , 98 3.2.2 Substantifs qualifiés du type « adjectif + nom + nom, Extraction et sélection primaires des substantifs qualifiés, p.102

, 3.2 Sélection des syntagmes nominaux par leur base

. .. Cooccurrences, 109 3.4.1 Recherche et identification des modèles numériques, p.111

T. Données and . Et, , p.121

. .. , Recherche des mots les plus fréquents des deux corpus, p.121

, Recherche des cooccurrences immédiates à gauche et à droite, p.122

. .. , Un graphe des locutions construites par cooccurrence, p.124

, Une sémantique lexicale revisitée 128

.. .. Strates, 5.1.3 La stratification discursive des documents source, p.147

. .. Concepts, 2.2 Les entités typées de l'ontologie du domaine

. .. Statut, 172 5.3.1 Statut et fonctions des unités lexicales chez Anna Wierzbicka, p.177

. .. Un-lexique-bilingue,

, A Annexes du chapitre, vol.1

, A.1 Exemples de définition d'unités lexicales

, B Annexes du chapitre, vol.2, p.194

. .. , Étiquettes morphosyntaxiques de l'anglais

. .. , Recherche des noms des modèles mathématiques (Floodrisk 2016)

C. , Préfixes des instances de certaines classes

, Acronymes des noms de classes

, Construction du lexique sur une partition de la base de connaissance

, Graphe relationnel des mouvements d'eau et des flux anthropiques

, Graphe relationnel des prélèvements d'eau en lien avec les flux anthropiques

, Graphe relationnel de la période d'occurrence des flux anthropiques

. .. , Graphe relationnel du comptage des prélèvements d'eau, p.11

, Graphe relationnel

, Usage de l'eau prélevée et implication humaine dans les prélèvements, p.12

, Liste hiérarchisée des propriétés à valeur de l'ontologie du domaine, p.13

«. Propriétés and . Héritées,

, Écran d'accueil du système d'information sur l'eau du bassin Adour-Garonne, vol.16

, Données du SIE Adour-Garonne sur le 'Point de prélèvement I82072101, p.16

, Carte de la commune de Golfech éditée dans le SIE Adour-Garonne (extrait), p.17

. .. , Extrait de l'introduction de la note 'Données prélèvements' (extrait), vol.18

. .. , Connexion des points de prélèvement (extrait), vol.18

L. .. Centrale-nucléaire-de-golfech-vue-d'auvillar, 19 1.18 Intégration dans l'ontologie du domaine des données du SIE Adour-Garonne sur les prélèvements effectués en, 2016.

. .. Domaine, , p.22

, Place de la production d'énergie dans le thème « Usage de la ressource, p.23

, Instances de la classe « Production d'énergie » (usage industriel de la ressource, p.24

. .. Dans-le-lexique, , p.26

. .. , Exemple d'une unité discursive alternative en anglais, p.28

, Classe et sous-classes des établissements publics dans l'ontologie du domaine, vol.29

. .. Instances, , p.29

, Forme développée de l'acronyme BRGM en annotation de l'instance typée, p.30

, Trois classes d'acronymes et de formes développées

, Graphe relationnel des noms propres lexicalisés avec un exemple, p.31

, Graphe relationnel des textes des unités lexicales

G. De-proximité-de-la-classe-«-prélèvement-d'eau and ». .. , , p.33

, Glose principale de l'unité lexicale pivot « 1-TS Prélèvement d'eau, p.34

, Glose de l'unité lexicale pivot « 1-TS Flux d'eau anthropique, p.34

, Définition de « 3-TA Masse d'eau rivière » dans la directive cadre sur l'eau, p.35

. .. , Graphe relationnel de la définition des masses d'eau rivière, p.35

». .. Exemple-d'emploi-du-nom-propre-lexicalisé-«-Électricité-de-france, , p.36

, Exemple d'emploi de l'unité discursive alternative « Uda Prélèvement d'eau, p.36

, Graphe des relations entre unités lexicales de la même strate discursive, p.37

. .. , Hiérarchie des masses d'eau dans l'ontologie du domaine, p.38

». .. Hyponymes-de-l'unité-lexicale-«-3-ta-masse-d'eau, , p.38

». .. Hyponymes-de-l'unité-«-3-ta-masse-d'eau-de-surface, , p.38

.. .. Schéma-d'ensemble-du-dispositif,

, Trois classes d'entités à la racine de l'ontologie de base de connaissance, p.41

, Graphe relationnel

, Graphe relationnel des partitions textuelles

. .. Lexique, Graphe relationnel des textes et des hors-textes du, p.44

, Graphe relationnel de l'exploitation des documents dans l'ontologie du domaine 45

, Réalisations étiquetées des mots du lemme « éthique » sur la même partition, p.47

. .. , 48 2.10 Réalisations étiquetées des mots du lemme « éthique » dans le texte MJG, p.49

». Concordances-de-l'adjectif-«-Éthique and M. .. Dans-le-texte, , p.49

. .. Édition, , p.50

, Lemmes présents 9 fois ou plus dans la résolution des Nations Unies, p.50

, Concordances du lemme « eau » dans la résolution des Nations Unies, p.51

. .. , Cooccurrents du lemme « eau » sur 4 lemmes à G et à D (rés. 64/292), p.51

, Cooccurrents du lemme « potable » sur 4 lemmes à droite (rés. 64/292), p.52

, Cooccurrents de la suite « potable-et-à » sur 2 mots à droite (rés. 64/292), p.52

. .. , Cooccurrents du lemme « eau » sur 1 mot à gauche (rés. 64/292), p.52

. .. , Cooccurrents de la suite « le-eau » sur 2 mots à gauche (rés. 64/292), p.53

, Concordances de la 2ème expression dans TXM (Résolution des Nations Unies, p.53

, Édition de la 2ème expression dans TXM (Résolution des Nations Unies) . . . . 53 2.22 Réalisations des « mots » du lemme « @card@, p.54

C. Mot, , p.54, 2013.

, Lemmes étiquetés « num » hors lemme « @card@ » (corpus ETHIQUE), p.55

, Autres pos réalisés dans le corpus FLR-1 édités avec lemmes et « mots, p.57

, Lemmes étiquetés « cd » dans la partition du corpus FLR-1 par thème, p.58

, Pos des lemmes « first » et « second » dans la partition FLR-1, p.58

. .. , Extrait de la page 1 du document source, p.61

. Vue and . .. Txt, , p.62

, Vue dans TXM du même extrait du texte importé avec le module ODT, p.62

. .. Txm, Corpus des textes sur l'eau et l'éthique importés dans, p.64

. .. , Adjectifs récurrents du corpus Ethique-tex (Fmin=30), p.65

. .. , Substantifs « qualifiés » du corpus Ethique-tex (Fmin=4), p.65

, 67 2.35 Dénombrement des pos réalisés dans FLOODRISK 2016-1 et FLR-1, Quatre corpus créés dans TXM sur la conférence FLOODRISK, p.68, 2016.

F. .. Dans, , p.69, 2018.

. .. , Corpus des articles de janvier 2018 du Guardian dans TXM, p.70

, Huit textes avec une/des références à Gumbel et/ou Weibull (corpus FLR-1), p.73

, Les 10 communications où figure le nom propre « Monte Carlo, p.73

, Substantifs les plus fréquents dans FLR-1 et FLR-01 à FLR-04, p.74

, Requête par index de la fréquence des 42 substantifs de la liste agrégée, p.74

. .. , Fréquence des 42 substantifs et thèmes/textes « en ayant » (début), p.75

. .. , Fréquence des 42 substantifs et thèmes/textes « en ayant » (fin), p.75

, Substantifs les plus fréquents dans FLR-02 et chacun de ses textes, p.76

, Liste alphabétique des 51 substantifs les plus fréquents

, Fréquence des 51 substantifs et textes « en ayant

, Fréquence des 51 substantifs et textes « en ayant » du corpus FLR-02 (fin), p.78

, Substantifs les plus fréquents dans FLR-02 et dans ses textes, p.79

, Deuxième liste agrégée des 66 substantifs dans FLR-02 et dans ses textes, p.79

, Substantifs de la 2ème liste agrégée présents dans les 4 textes

, Substantifs de la 2ème liste agrégée présents dans 3 textes sur, vol.4

, Substantifs de la 2ème liste agrégée présents dans 2 textes sur 4 (FLR-02), p.81

, Substantifs de la 2ème liste agrégée présents dans 1 texte sur 4 (FLR-02), p.81

, Fréquence et intégration des substantifs présents dans les 4 textes (début), p.83

. .. , Fréquence et intégration des substantifs présents dans les 4 textes (fin), vol.83

, Fréquence et intégration des substantifs présents dans 3 textes sur 4, p.84

, Fréquence des substantifs présents dans 2 textes sur 4

, Fréquence et intégration des substantifs présents dans 1 seul texte, p.85

, Intégration dans le lexique des substantifs présents dans moins de 4 textes, p.86

, Lexicalisation des noms, des syntagmes nominaux et des noms propres, vol.87

. Graphe-de-la-«-remontée, , vol.87

. .. Fréquence-du-lemme-«-copula-»-dans-le-corpus-flr-1, , p.88

». .. Début-de-l'article-de-wikipedia-sur-le-substantif-«-copula, , p.89

, Début de l'article de Wikipedia sur la copule en mathématiques, p.89

, Le calcul des probabilités parmi les disciplines et les matières du lexique, p.89

. .. Extrait-d'un-article-de-wikipedia-consacré-À-la-loi-de-gumbel, , p.90

, Sélection des suites « nom+nom

, Les 53 suites « nom+nom » sélectionnées dans les textes et le corpus

, Les 71 noms extraits des 53 suites « nom+nom » sélectionnées, p.93

, Les 25 suites de deux noms partagées entre des textes de FLR-02, p.93

, Les 85 suites spécifiques de deux noms dans les textes de FLR-02, p.94

, Sélection des suites de trois noms dans FLR-02 et dans les 4 textes, p.95

, Les 37 suites de 3 noms sélectionnées dans FLR-02 et dans les 4 textes, p.95

, Liste des 59 noms, avec séparateurs, des 37 suites de 3 noms sélectionnées, p.95

, Les 4 suites « nom+nom+nom » partagées entre les textes de FLR-02, p.96

, Les 54 suites « nom+nom+nom » spécifiques des textes de FLR-02, p.96

, Recherche des suites de 4 noms dans la partition FLR-02

, Suites spécifiques de 4 noms des textes du corpus FLR-02, p.97

, Syntagmes « adjectif+nom » les plus fréquents dans FLR-02 et ses textes, p.98

, Requête sur les syntagmes « adjectif+nom » avec les adjectifs de la figure 3, vol.13, p.99

«. Syntagmes and . Adjectif+nom, , p.99

«. Syntagmes and . Spécifiques,

, Syntagmes « adjectif+nom+nom » les plus fréquents, corpus et textes

, Adjectifs récurrents du corpus FLR-02 et de ses textes (syntagmes figure 3.17), p.101

, Recherche des syntagmes « adjectifs récurrent + nom + nom » (requête), p.101

, Syntagmes partagés « adjectif récurrent + nom + nom », textes FLR-02, p.102

, Syntagmes spécifiques « adjectif récurrent + nom + nom

, Syntagmes spécifiques « adjectif + nom + nom + nom », textes FLR-02, p.103

, Rapprochement des bases nominales et des substantifs sélectionnés, vol.104

, Requêtes de recherche des syntagmes nominaux à partir de leur base nominale, p.105

, Syntagmes nominaux étiquetés de la base « flood », corpus FLR-02 (début), p.106

, Syntagmes nominaux étiquetés de la base « flood », corpus FLR-02 (fin), p.106

, Édition de National Flood Risk Assessment dans le texte source, p.107

, Syntagmes nominaux sans étiquettes (base flood hors noms propres

, Graphe relationnel du transfert de storm surge dans le lexique, p.110

, Noms propres des modèles dans les textes du corpus FLR-02, p.112

. .. , Voisinage textuel de la collocation Delft3D model (texte FLR-02001), vol.112

, Présentation du modèle Delft3D sur le site de Deltarès

. .. , Voisinage textuel du syntagme Agency model (texte 02004), p.113

. .. , Voisinage textuel du syntagme ARPEGE-Climat model (texte 02003), p.113

. .. , Guide d'utilisation des données d'EURO-CORDEX (extrait), p.113

, Voisinage textuel du syntagme Teign Estuaries Hydraulic models, p.114

. .. , Voisinage textuel du syntagme Isba model (texte 02003), p.114

. .. , Voisinage textuel du syntagme Mesoscale model (texte 02002), p.115

. .. , Voisinage textuel du syntagme model Cfflood (texte 02001), p.115

. .. , Voisinage textuel du syntagme model Eu-dem (texte 02001), p.116

E. Présentation-du-modèle-numérique and . .. Le-site-de-l'aee, , p.116

. .. , Voisinage textuel du syntagme Swan wave model (texte 02004), p.116

. .. , Voisinage textuel du syntagme Pot models (texte 02004), p.117

. .. , Voisinage textuel du syntagme tpx08 tide model (texte 02001), p.117

. .. , Présentation de la série des modèles de marées TPXO (extrait), vol.118

. .. , Les noms propres des modèles à lexicaliser (FLR-02), p.119

, Partage des modèles à lexicaliser du corpus FLR-02 dans le corpus FLR-1, p.119

, Fréquences de 5 premiers lemmes du Guardian par tranches annuelles, p.122

, Fréquences de 5 premiers lemmes de la directive européenne sur les inondations 122

, Les deux réseaux des cooccurrences de flood dans les articles du Guardian, p.125

, Réseau des cooccurrents de flood et river dans la directive « Inondations, p.127

, Les quatre strates discursives en tant qu'entités du discours, p.134

, Les 20 classes d'aléas prises en compte dans l'ontologie du domaine, p.135

, Graphe des « vigilances » datées et localisées, par type d'aléa et par niveau, p.136

, Graphe relationnel de l'inscription de l'aléa dans le temps, p.137

, Graphe relationnel des aléas et de la vigilance en matière de risques naturels, vol.138

, Une carte de la vigilance météorologique départementale bi-quotidienne, p.139

. .. , Vigilance météorologique pour le département du Morbihan (extrait), p.140

. .. , Vigilance météorologique pour le département du Finistère (extrait), p.140

, Un carte de la vigilance « crues » pour

, Un carte de la vigilance « crues » pour le territoire « Vilaine-Côtiers Bretons, p.142

, Modélisation des zones inondées par débordement des tronçons vigicrues, p.143

, Inondation de rivière par débordement de ses tronçons hydrographiques, p.143

, Graphe du rapprochement des pluies et des crues sur un bassin versant, p.144

, Graphe relationnel d'une catastrophe résultant de la rupture d'un barrage, p.145

, Extrait de l'arrêt du Conseil d'État sur la rupture du barrage de Malpasset, p.146

. .. , La rupture du barrage de Malpasset (extrait de Wikipedia), p.146

, La catastrophe de la rupture du barrage de Malpasset (extrait de Wikipedia), p.146

, Graphe relationnel des strates discursives

. .. , Graphe relationnel aux frontières des trois ontologies, p.149

. .. Domaine, Graphe relationnel des classes primaires du, p.150

. .. , Classement des thèmes du domaine (hors usages de la ressource), p.151

L. Classes-du-thème-«-usage-de-la-ressource and ». .. , , p.151

, Les thèmes, de « Drainage du sol » à « Navigation » (hors cultures agricoles), p.152

». .. Les-thèmes-de-la-classe-«-politique-de-l'eau, , p.152

L. Cultures-du-thème-«-culture-agricole and ». .. , , p.153

, Les thèmes des classes « Processus naturel » et « Procédé industriel, p.154

, Les thèmes des classes « Pêche aquaculture » à « Réchauffement climatique, p.154

, Les thèmes des classes « Ressource en eau » à « Substance chimique, p.155

, Les thèmes de l'usage de la ressource, de l'AEP au traitement des eaux usées, p.155

L. .. , , p.156

, Les thèmes de l'usage domestique et de l'usage thérapeutique de la ressource, p.156

, Les thèmes de l'usage industriel de la ressource

, Disciplines et documents du domaine en relation avec le lexique et le corpus, vol.158

L. .. , , p.159

, Graphe relationnel des entités typées primaires de l'ontologie du domaine, p.160

, Graphe relationnel des codes et identifiants

. Définition and . .. De-wikipedia, , p.161

, Graphe relationnel du référentiel temporel

, Définition bilingue du temps universel coordonné, tirée de Wikipedia, p.162

. .. , Format d'écriture d'une date et heure en UTC pour Paris (standard), p.163

. .. , Format d'écriture d'une date et heure en UTC pour Paris (heure d'été), p.163

, Graphe relationnel des entités géographiques de l'eau souterraine, p.164

. Nature and . .. Lisa, , p.165

. .. , Présentation de la BDLISA sur le site du BRGM (extrait), p.166

, Graphe relationnel des entités géographiques

, Carte des 9 districts hydrographiques pour la France métropolitaine, p.168

, Relations internes

, Relations externes des entités du lexique avec celles du domaine, p.170

. .. , Relations des entités du lexique avec les textes du lexique, p.171

, Relations entre les entités primaires du discours et avec les entités du domaine, p.171

, Graphe de l'extraction d'éléments lexicaux récurrents des corpus textuels, p.172

. Fonction-d'une-entrée-du-lexique-selon-m.-lynne and . .. Murphy, , p.173

. .. , Définition d'une tasse à café à partir de sa conception (A. Wierzbicka), p.175

). .. Article, , p.179

. Article and ). .. Le-vocable-«-tempête-;-fin, , p.180

, Graphe relationnel des noms récurrents alternatifs de « 4-C Inondation, p.183

». .. L'unité-discursive-centrale-«-udc-prélèvement-d'eau, , p.184

». .. L'unité-discursive-alternative-«-uda-prélèvement-d'eau, , p.185

». .. L'unité-lexicale-«-3-ta-prélèvement-d'eau, , p.186

». .. L'unité-lexicale-«-4-c-prélèvement-d'eau, , p.186

». .. , Définition de l'unité lexicale « 3-TA Prélèvement, p.187

». .. , Définition de l'unité lexicale « 4-C Prélèvement, p.187

A. , Définition bilingue de l'unité lexicale pivot « 1-TS Prélèvement d'eau, p.190

, Définition des prélèvements d'eau au sens de la police de l'eau, p.191

. .. , Définition des prélèvements d'eau soumis à redevance, p.191

, Définition des prélèvements d'eau selon l'OCDE

, Définition des aléas en termes de prévention de risques naturels, p.193

A. , Définition des inondations dans la strate discursive courante, p.193

. .. , Étiquettes morphosyntaxiques de l'anglais (début)

, Étiquettes morphosyntaxiques de l'anglais (fin)

. .. , Recherche des noms des modèles mathématiques (1/3, corpus FLR-02)

, Recherche des noms des modèles mathématiques

, Recherche des noms des modèles mathématiques

. .. , 55 2.2 Les étiquettes morphosyntaxiques du français dans TXM (fin), Liste des tableaux 2.1 Les étiquettes morphosyntaxiques du français dans TXM (début)

. .. , 66 2.7 Les six thèmes directeurs de la conférence FLOODrisk, Les 24 thèmes de la conférence FLOODrisk, p.66, 2016.

, Les 14 premiers lemmes après 'flood' dans les articles du Guardian, p.123

É. De-taille-de-la-police and .. .. ,

.. .. Échelle,

, Cooccurrences en chaîne à droite de flood et river dans la directive « Inondations, p.126

, Adjectifs cooccurrents à gauche de flood et river, directive « Inondations, p.126

. .. , Collocations avec 'flood' et 'river' (directive 'Inondations'), p.126

. .. , An explication of happy with the NSM metalanguage

, Les étiquettes morphosyntaxiques du français, p.195

C. , Glossaire des préfixes en français et en anglais

, Glossaire des acronymes en français et en anglais

L. Depecker, Entre signe et concept, éléments de terminologie générale, 2003.

D. La-langue-française-;-générale-À-la-langue-française and C. Goddard, Dictionnaire des termes ociels de la langue française, 1994.

R. Huddleston-;-huddleston, W. V. Humboldt, and V. Johanet, English grammar : an outline. Cambridge University Press, Johanet, 1903.

A. Jousse, Modèle de structuration des relations lexicales fondé sur le formalisme des fonctions lexicales, 2010.

S. Kripke-;-kripke, Naming and necessity, 1980.

S. Kripke-;-kripke and G. W. Leibnitz, La logique des noms propres. Les éditions de minuit, 1903.

. Linton and J. Linton, What is water, 2010.
URL : https://hal.archives-ouvertes.fr/hal-01994560

. Mel'?uk, Dictionnaire explicatif et combinatoire du français contemporain, recherches lexico-sémantiques II, 1988.

. Mel'?uk, Dictionnaire explicatif et combinatoire du français contemporain, recherches lexico-sémantiques I, 1984.

. Mel'?uk, Dictionnaire explicatif et combinatoire du français contemporain, recherches lexico-sémantiques III, 1992.

. Mel'?uk, Dictionnaire explicatif et combinatoire du français contemporain, recherches lexico-sémantiques IV, 1995.

R. Miller-;-miller, L. Mouton, and . Haye, The Linguistic Relativity Principle anf Humboldtian Ethnolinguistics, 1968.

. Murphy and M. L. Murphy, Lexical meaning, 2010.

F. Neveu and B. Russel, Dictionnaire des sciences du langage. Armand Colin, On denoting. Mind, vol.14, pp.479-493, 1905.
URL : https://hal.archives-ouvertes.fr/hal-00012526

A. Wierzbicka and A. Wierzbicka, Semantic primitives. Athenäum, Frankfurt, 1972.

A. Wierzbicka, Semantics, Culture and Cognition : universal human concepts in Culture-Specific Configurations, Semantics : Primes and Universals, 1992.