, UN LEXIQUE BILINGUE un enrichissement de l'ontologie pour articuler les nouvelles unités lexicales pivot et satellites
, Dans les tests que nous avons effectués, les textes du domaine ont été les arbitres de l'enrichis
, Des essais en vraie grandeur du dispositif de consultation et d'enrichissement sont nécessaires, avec la mise en oeuvre informatisée des logiciels utilisés « à la main » dans notre travail et une interface appropriée sur un portail internet testé par des utilisateurs et des contributeurs. Nous entrons là dans le domaine du projet LEXEAU®. Nous espérons qu'il permettra d'associer des linguistes intéressés par des recherches liées à des applications opérationnelles à la réalisation d'un projet pilote, confié à un groupe de projet, Les tests effectués ont permis de développer un modèle robuste de réalisation d'un lexique stratifié du domaine de l'eau
Les annexes sont présentées dans une version provisoire au 15/12/2018, très incomplète. Elles devraient être finalisées avant la présentation de la thèse ,
UNITÉS LEXICALES Figure A.4 -Définition des prélèvements d'eau selon l'OCDE ,
,
, Les figures B.1 et B.2 sont des copies d
1 -Étiquettes morphosyntaxiques de l'anglais (début) ,
,
, Une partition de la base de connaissance
, 3.1 « Données » et « propriétés » dans l'ontologie du domaine, p.14
,
,
,
, 32 1.8.1 Des définitions et de gloses pour les unités lexicales pivot
, Les fondements du projet LEXEAU®, vol.39
,
41 2.2.1 Documents, textes documentés et corpus textuels ,
46 2.3.1 Dénombrer les « réalisations » d'une unité linguistique ,
63 2.4.1 Un petit corpus sur le thème de l'eau et l'éthique, p.68 ,
5.2 Des noms propres et des substantifs pour le lexique, p.71 ,
86 2.6.1 Des définitions adaptées au domaine de connaissance, p.88 ,
, Des syntagmes et des cooccurrences 91
91 3.1.1 Suites de deux noms, Extraction et sélection primaire des suites de noms ,
98 3.2.2 Substantifs qualifiés du type « adjectif + nom + nom, Extraction et sélection primaires des substantifs qualifiés, p.102 ,
, 3.2 Sélection des syntagmes nominaux par leur base
109 3.4.1 Recherche et identification des modèles numériques, p.111 ,
, , p.121
Recherche des mots les plus fréquents des deux corpus, p.121 ,
, Recherche des cooccurrences immédiates à gauche et à droite, p.122
Un graphe des locutions construites par cooccurrence, p.124 ,
, Une sémantique lexicale revisitée 128
5.1.3 La stratification discursive des documents source, p.147 ,
2.2 Les entités typées de l'ontologie du domaine ,
172 5.3.1 Statut et fonctions des unités lexicales chez Anna Wierzbicka, p.177 ,
,
, A Annexes du chapitre, vol.1
, A.1 Exemples de définition d'unités lexicales
, B Annexes du chapitre, vol.2, p.194
Étiquettes morphosyntaxiques de l'anglais ,
Recherche des noms des modèles mathématiques (Floodrisk 2016) ,
Préfixes des instances de certaines classes ,
, Acronymes des noms de classes
, Construction du lexique sur une partition de la base de connaissance
, Graphe relationnel des mouvements d'eau et des flux anthropiques
, Graphe relationnel des prélèvements d'eau en lien avec les flux anthropiques
, Graphe relationnel de la période d'occurrence des flux anthropiques
, Graphe relationnel du comptage des prélèvements d'eau, p.11
, Graphe relationnel
, Usage de l'eau prélevée et implication humaine dans les prélèvements, p.12
, Liste hiérarchisée des propriétés à valeur de l'ontologie du domaine, p.13
,
, Écran d'accueil du système d'information sur l'eau du bassin Adour-Garonne, vol.16
, Données du SIE Adour-Garonne sur le 'Point de prélèvement I82072101, p.16
, Carte de la commune de Golfech éditée dans le SIE Adour-Garonne (extrait), p.17
Extrait de l'introduction de la note 'Données prélèvements' (extrait), vol.18 ,
Connexion des points de prélèvement (extrait), vol.18 ,
19 1.18 Intégration dans l'ontologie du domaine des données du SIE Adour-Garonne sur les prélèvements effectués en, 2016. ,
, , p.22
, Place de la production d'énergie dans le thème « Usage de la ressource, p.23
, Instances de la classe « Production d'énergie » (usage industriel de la ressource, p.24
, , p.26
Exemple d'une unité discursive alternative en anglais, p.28 ,
, Classe et sous-classes des établissements publics dans l'ontologie du domaine, vol.29
, , p.29
, Forme développée de l'acronyme BRGM en annotation de l'instance typée, p.30
, Trois classes d'acronymes et de formes développées
, Graphe relationnel des noms propres lexicalisés avec un exemple, p.31
, Graphe relationnel des textes des unités lexicales
, , p.33
, Glose principale de l'unité lexicale pivot « 1-TS Prélèvement d'eau, p.34
, Glose de l'unité lexicale pivot « 1-TS Flux d'eau anthropique, p.34
, Définition de « 3-TA Masse d'eau rivière » dans la directive cadre sur l'eau, p.35
Graphe relationnel de la définition des masses d'eau rivière, p.35 ,
, , p.36
, Exemple d'emploi de l'unité discursive alternative « Uda Prélèvement d'eau, p.36
, Graphe des relations entre unités lexicales de la même strate discursive, p.37
Hiérarchie des masses d'eau dans l'ontologie du domaine, p.38 ,
, , p.38
, , p.38
,
, Trois classes d'entités à la racine de l'ontologie de base de connaissance, p.41
, Graphe relationnel
, Graphe relationnel des partitions textuelles
, Graphe relationnel des textes et des hors-textes du, p.44
, Graphe relationnel de l'exploitation des documents dans l'ontologie du domaine 45
, Réalisations étiquetées des mots du lemme « éthique » sur la même partition, p.47
48 2.10 Réalisations étiquetées des mots du lemme « éthique » dans le texte MJG, p.49 ,
, , p.49
, , p.50
, Lemmes présents 9 fois ou plus dans la résolution des Nations Unies, p.50
, Concordances du lemme « eau » dans la résolution des Nations Unies, p.51
Cooccurrents du lemme « eau » sur 4 lemmes à G et à D (rés. 64/292), p.51 ,
, Cooccurrents du lemme « potable » sur 4 lemmes à droite (rés. 64/292), p.52
, Cooccurrents de la suite « potable-et-à » sur 2 mots à droite (rés. 64/292), p.52
Cooccurrents du lemme « eau » sur 1 mot à gauche (rés. 64/292), p.52 ,
Cooccurrents de la suite « le-eau » sur 2 mots à gauche (rés. 64/292), p.53 ,
, Concordances de la 2ème expression dans TXM (Résolution des Nations Unies, p.53
, Édition de la 2ème expression dans TXM (Résolution des Nations Unies) . . . . 53 2.22 Réalisations des « mots » du lemme « @card@, p.54
, , p.54, 2013.
, Lemmes étiquetés « num » hors lemme « @card@ » (corpus ETHIQUE), p.55
, Autres pos réalisés dans le corpus FLR-1 édités avec lemmes et « mots, p.57
, Lemmes étiquetés « cd » dans la partition du corpus FLR-1 par thème, p.58
, Pos des lemmes « first » et « second » dans la partition FLR-1, p.58
Extrait de la page 1 du document source, p.61 ,
, , p.62
, Vue dans TXM du même extrait du texte importé avec le module ODT, p.62
, Corpus des textes sur l'eau et l'éthique importés dans, p.64
Adjectifs récurrents du corpus Ethique-tex (Fmin=30), p.65 ,
, Substantifs « qualifiés » du corpus Ethique-tex (Fmin=4), p.65
, 67 2.35 Dénombrement des pos réalisés dans FLOODRISK 2016-1 et FLR-1, Quatre corpus créés dans TXM sur la conférence FLOODRISK, p.68, 2016.
, , p.69, 2018.
, Corpus des articles de janvier 2018 du Guardian dans TXM, p.70
, Huit textes avec une/des références à Gumbel et/ou Weibull (corpus FLR-1), p.73
, Les 10 communications où figure le nom propre « Monte Carlo, p.73
, Substantifs les plus fréquents dans FLR-1 et FLR-01 à FLR-04, p.74
, Requête par index de la fréquence des 42 substantifs de la liste agrégée, p.74
Fréquence des 42 substantifs et thèmes/textes « en ayant » (début), p.75 ,
Fréquence des 42 substantifs et thèmes/textes « en ayant » (fin), p.75 ,
, Substantifs les plus fréquents dans FLR-02 et chacun de ses textes, p.76
, Liste alphabétique des 51 substantifs les plus fréquents
, Fréquence des 51 substantifs et textes « en ayant
, Fréquence des 51 substantifs et textes « en ayant » du corpus FLR-02 (fin), p.78
, Substantifs les plus fréquents dans FLR-02 et dans ses textes, p.79
, Deuxième liste agrégée des 66 substantifs dans FLR-02 et dans ses textes, p.79
, Substantifs de la 2ème liste agrégée présents dans les 4 textes
, Substantifs de la 2ème liste agrégée présents dans 3 textes sur, vol.4
, Substantifs de la 2ème liste agrégée présents dans 2 textes sur 4 (FLR-02), p.81
, Substantifs de la 2ème liste agrégée présents dans 1 texte sur 4 (FLR-02), p.81
, Fréquence et intégration des substantifs présents dans les 4 textes (début), p.83
, Fréquence et intégration des substantifs présents dans les 4 textes (fin), vol.83
, Fréquence et intégration des substantifs présents dans 3 textes sur 4, p.84
, Fréquence des substantifs présents dans 2 textes sur 4
, Fréquence et intégration des substantifs présents dans 1 seul texte, p.85
, Intégration dans le lexique des substantifs présents dans moins de 4 textes, p.86
, Lexicalisation des noms, des syntagmes nominaux et des noms propres, vol.87
, , vol.87
, , p.88
, , p.89
, Début de l'article de Wikipedia sur la copule en mathématiques, p.89
, Le calcul des probabilités parmi les disciplines et les matières du lexique, p.89
, , p.90
, Sélection des suites « nom+nom
, Les 53 suites « nom+nom » sélectionnées dans les textes et le corpus
, Les 71 noms extraits des 53 suites « nom+nom » sélectionnées, p.93
, Les 25 suites de deux noms partagées entre des textes de FLR-02, p.93
, Les 85 suites spécifiques de deux noms dans les textes de FLR-02, p.94
, Sélection des suites de trois noms dans FLR-02 et dans les 4 textes, p.95
, Les 37 suites de 3 noms sélectionnées dans FLR-02 et dans les 4 textes, p.95
, Liste des 59 noms, avec séparateurs, des 37 suites de 3 noms sélectionnées, p.95
, Les 4 suites « nom+nom+nom » partagées entre les textes de FLR-02, p.96
, Les 54 suites « nom+nom+nom » spécifiques des textes de FLR-02, p.96
, Recherche des suites de 4 noms dans la partition FLR-02
, Suites spécifiques de 4 noms des textes du corpus FLR-02, p.97
, Syntagmes « adjectif+nom » les plus fréquents dans FLR-02 et ses textes, p.98
, Requête sur les syntagmes « adjectif+nom » avec les adjectifs de la figure 3, vol.13, p.99
, , p.99
,
, Syntagmes « adjectif+nom+nom » les plus fréquents, corpus et textes
, Adjectifs récurrents du corpus FLR-02 et de ses textes (syntagmes figure 3.17), p.101
, Recherche des syntagmes « adjectifs récurrent + nom + nom » (requête), p.101
, Syntagmes partagés « adjectif récurrent + nom + nom », textes FLR-02, p.102
, Syntagmes spécifiques « adjectif récurrent + nom + nom
, Syntagmes spécifiques « adjectif + nom + nom + nom », textes FLR-02, p.103
, Rapprochement des bases nominales et des substantifs sélectionnés, vol.104
, Requêtes de recherche des syntagmes nominaux à partir de leur base nominale, p.105
, Syntagmes nominaux étiquetés de la base « flood », corpus FLR-02 (début), p.106
, Syntagmes nominaux étiquetés de la base « flood », corpus FLR-02 (fin), p.106
, Édition de National Flood Risk Assessment dans le texte source, p.107
, Syntagmes nominaux sans étiquettes (base flood hors noms propres
, Graphe relationnel du transfert de storm surge dans le lexique, p.110
, Noms propres des modèles dans les textes du corpus FLR-02, p.112
Voisinage textuel de la collocation Delft3D model (texte FLR-02001), vol.112 ,
, Présentation du modèle Delft3D sur le site de Deltarès
Voisinage textuel du syntagme Agency model (texte 02004), p.113 ,
Voisinage textuel du syntagme ARPEGE-Climat model (texte 02003), p.113 ,
Guide d'utilisation des données d'EURO-CORDEX (extrait), p.113 ,
, Voisinage textuel du syntagme Teign Estuaries Hydraulic models, p.114
Voisinage textuel du syntagme Isba model (texte 02003), p.114 ,
Voisinage textuel du syntagme Mesoscale model (texte 02002), p.115 ,
Voisinage textuel du syntagme model Cfflood (texte 02001), p.115 ,
Voisinage textuel du syntagme model Eu-dem (texte 02001), p.116 ,
, , p.116
Voisinage textuel du syntagme Swan wave model (texte 02004), p.116 ,
Voisinage textuel du syntagme Pot models (texte 02004), p.117 ,
Voisinage textuel du syntagme tpx08 tide model (texte 02001), p.117 ,
Présentation de la série des modèles de marées TPXO (extrait), vol.118 ,
Les noms propres des modèles à lexicaliser (FLR-02), p.119 ,
, Partage des modèles à lexicaliser du corpus FLR-02 dans le corpus FLR-1, p.119
, Fréquences de 5 premiers lemmes du Guardian par tranches annuelles, p.122
, Fréquences de 5 premiers lemmes de la directive européenne sur les inondations 122
, Les deux réseaux des cooccurrences de flood dans les articles du Guardian, p.125
, Réseau des cooccurrents de flood et river dans la directive « Inondations, p.127
, Les quatre strates discursives en tant qu'entités du discours, p.134
, Les 20 classes d'aléas prises en compte dans l'ontologie du domaine, p.135
, Graphe des « vigilances » datées et localisées, par type d'aléa et par niveau, p.136
, Graphe relationnel de l'inscription de l'aléa dans le temps, p.137
, Graphe relationnel des aléas et de la vigilance en matière de risques naturels, vol.138
, Une carte de la vigilance météorologique départementale bi-quotidienne, p.139
Vigilance météorologique pour le département du Morbihan (extrait), p.140 ,
Vigilance météorologique pour le département du Finistère (extrait), p.140 ,
, Un carte de la vigilance « crues » pour
, Un carte de la vigilance « crues » pour le territoire « Vilaine-Côtiers Bretons, p.142
, Modélisation des zones inondées par débordement des tronçons vigicrues, p.143
, Inondation de rivière par débordement de ses tronçons hydrographiques, p.143
, Graphe du rapprochement des pluies et des crues sur un bassin versant, p.144
, Graphe relationnel d'une catastrophe résultant de la rupture d'un barrage, p.145
, Extrait de l'arrêt du Conseil d'État sur la rupture du barrage de Malpasset, p.146
, La rupture du barrage de Malpasset (extrait de Wikipedia), p.146
, La catastrophe de la rupture du barrage de Malpasset (extrait de Wikipedia), p.146
, Graphe relationnel des strates discursives
, Graphe relationnel aux frontières des trois ontologies, p.149
, Graphe relationnel des classes primaires du, p.150
Classement des thèmes du domaine (hors usages de la ressource), p.151 ,
, , p.151
, Les thèmes, de « Drainage du sol » à « Navigation » (hors cultures agricoles), p.152
, , p.152
, , p.153
, Les thèmes des classes « Processus naturel » et « Procédé industriel, p.154
, Les thèmes des classes « Pêche aquaculture » à « Réchauffement climatique, p.154
, Les thèmes des classes « Ressource en eau » à « Substance chimique, p.155
, Les thèmes de l'usage de la ressource, de l'AEP au traitement des eaux usées, p.155
, , p.156
, Les thèmes de l'usage domestique et de l'usage thérapeutique de la ressource, p.156
, Les thèmes de l'usage industriel de la ressource
, Disciplines et documents du domaine en relation avec le lexique et le corpus, vol.158
, , p.159
, Graphe relationnel des entités typées primaires de l'ontologie du domaine, p.160
, Graphe relationnel des codes et identifiants
, , p.161
, Graphe relationnel du référentiel temporel
, Définition bilingue du temps universel coordonné, tirée de Wikipedia, p.162
Format d'écriture d'une date et heure en UTC pour Paris (standard), p.163 ,
Format d'écriture d'une date et heure en UTC pour Paris (heure d'été), p.163 ,
, Graphe relationnel des entités géographiques de l'eau souterraine, p.164
, , p.165
Présentation de la BDLISA sur le site du BRGM (extrait), p.166 ,
, Graphe relationnel des entités géographiques
, Carte des 9 districts hydrographiques pour la France métropolitaine, p.168
, Relations internes
, Relations externes des entités du lexique avec celles du domaine, p.170
Relations des entités du lexique avec les textes du lexique, p.171 ,
, Relations entre les entités primaires du discours et avec les entités du domaine, p.171
, Graphe de l'extraction d'éléments lexicaux récurrents des corpus textuels, p.172
, , p.173
Définition d'une tasse à café à partir de sa conception (A. Wierzbicka), p.175 ,
, , p.179
, , p.180
, Graphe relationnel des noms récurrents alternatifs de « 4-C Inondation, p.183
, , p.184
, , p.185
, , p.186
, , p.186
Définition de l'unité lexicale « 3-TA Prélèvement, p.187 ,
Définition de l'unité lexicale « 4-C Prélèvement, p.187 ,
Définition bilingue de l'unité lexicale pivot « 1-TS Prélèvement d'eau, p.190 ,
, Définition des prélèvements d'eau au sens de la police de l'eau, p.191
Définition des prélèvements d'eau soumis à redevance, p.191 ,
, Définition des prélèvements d'eau selon l'OCDE
, Définition des aléas en termes de prévention de risques naturels, p.193
Définition des inondations dans la strate discursive courante, p.193 ,
Étiquettes morphosyntaxiques de l'anglais (début) ,
, Étiquettes morphosyntaxiques de l'anglais (fin)
Recherche des noms des modèles mathématiques (1/3, corpus FLR-02) ,
, Recherche des noms des modèles mathématiques
, Recherche des noms des modèles mathématiques
55 2.2 Les étiquettes morphosyntaxiques du français dans TXM (fin), Liste des tableaux 2.1 Les étiquettes morphosyntaxiques du français dans TXM (début) ,
66 2.7 Les six thèmes directeurs de la conférence FLOODrisk, Les 24 thèmes de la conférence FLOODrisk, p.66, 2016. ,
, Les 14 premiers lemmes après 'flood' dans les articles du Guardian, p.123
,
,
, Cooccurrences en chaîne à droite de flood et river dans la directive « Inondations, p.126
, Adjectifs cooccurrents à gauche de flood et river, directive « Inondations, p.126
Collocations avec 'flood' et 'river' (directive 'Inondations'), p.126 ,
An explication of happy with the NSM metalanguage ,
, Les étiquettes morphosyntaxiques du français, p.195
Glossaire des préfixes en français et en anglais ,
, Glossaire des acronymes en français et en anglais
Entre signe et concept, éléments de terminologie générale, 2003. ,
Dictionnaire des termes ociels de la langue française, 1994. ,
English grammar : an outline. Cambridge University Press, Johanet, 1903. ,
Modèle de structuration des relations lexicales fondé sur le formalisme des fonctions lexicales, 2010. ,
Naming and necessity, 1980. ,
La logique des noms propres. Les éditions de minuit, 1903. ,
What is water, 2010. ,
URL : https://hal.archives-ouvertes.fr/hal-01994560
Dictionnaire explicatif et combinatoire du français contemporain, recherches lexico-sémantiques II, 1988. ,
Dictionnaire explicatif et combinatoire du français contemporain, recherches lexico-sémantiques I, 1984. ,
Dictionnaire explicatif et combinatoire du français contemporain, recherches lexico-sémantiques III, 1992. ,
Dictionnaire explicatif et combinatoire du français contemporain, recherches lexico-sémantiques IV, 1995. ,
The Linguistic Relativity Principle anf Humboldtian Ethnolinguistics, 1968. ,
Lexical meaning, 2010. ,
Dictionnaire des sciences du langage. Armand Colin, On denoting. Mind, vol.14, pp.479-493, 1905. ,
URL : https://hal.archives-ouvertes.fr/hal-00012526
Semantic primitives. Athenäum, Frankfurt, 1972. ,
Semantics, Culture and Cognition : universal human concepts in Culture-Specific Configurations, Semantics : Primes and Universals, 1992. ,