Weaving an ambiguous lexicon

Isabelle Dautriche

Résumé

Modern cognitive science of language concerns itself with (at least) two fundamental questions: how do humans learn language? —the learning problem —and why do the world’s languages exhibit some properties and not others? —the typology problem. In this dissertation, I attempt to link these two questions by looking at the lexicon, the set of word-forms and their associated meanings, and ask why do lexicons look the way they are? And can the properties exhibited by the lexicon be (in part) explained by the way children learn their language? One striking observation is that the set of words in a given language is highly ambiguous and confusable. Words may have multiple senses (e.g., homonymy, polysemy) and are represented by an arrangement of a finite set of sounds that potentially increase their confusability (e.g., minimal pairs). Lexicons bearing such properties present a problem for children learning their language who seem to have difficulty learning similar sounding words and resist learning words having multiple meanings. Using lexical models and experimental methods in toddlers and adults, I present quantitative evidence that lexicons are, indeed, more confusable than what would be expected by chance alone. I then present empirical evidence suggesting that toddlers have the tools to bypass these problems given that ambiguous or confusable words are constrained to appear in distinct context. Finally, I submit that the study of ambiguous words reveal factors that were currently missing from current accounts of word learning. Taken together this research suggests that ambiguous and confusable words, while present in the language, may be restricted in their distribution in the lexicon and that these restrictions reflect (in part) how children learn languages.

Il y a (au moins) deux questions fondamentales que l’on est amené à se poser lorsqu’on étudie le langage: comment acquiert-on le langage? —le problème d’apprentissage —et pourquoi les langues du monde partagent certaines propriétés mais pas d’autres? —le problème typologique. Dans cette thèse, j’entreprends de relier ces deux domaines en me focalisant sur le lexique, l’ensemble des mots de notre langue et leur sens associés, en posant les questions suivantes: pourquoi le lexique est-il tel qu’il est? Et est-ce que les propriétés du lexique peuvent être (en partie) expliquées par la façon dont les enfants apprennent leur langue? Un des aspects les plus frappants du lexique est que les mots que nous utilisons sont ambigus et peuvent être confondus facilement avec d’autres. En effet, les mots peuvent avoir plusieurs sens (par exemple, les homophones) et sont représentés par un ensemble limité de sons qui augmentent la possibilité qu’ils soient confondus (par exemple, les paires minimales). L’existence de ces mots semble présenter un problème pour les enfants qui apprennent leur langue car il a été montré qu’ils ont des difficultés à apprendre des mots dont les formes sonores sont proches et qu’ils résistent à l’apprentissage des mots ayant plusieurs sens. En combinant une approche computationnelle et expérimentale, je montre, quantitativement, que les mots du lexique sont, en effet, plus similaires que ce qui serait attendu par chance, et expérimentalement, que les enfants n’ont aucun problème à apprendre ces mots à la condition qu’ils apparaissent dans des contextes suffisamment distincts. Enfin, je propose que l’étude des mots ambigus permet de révéler des éléments importants du mécanisme d’apprentissage du langage qui sont actuellement absents des théories actuelles. Cet ensemble d’études suggère que les mots ambigus et les mots similaires, bien que présents dans le langage, n’apparaissent pas arbitrairement dans le langage et que leur organisation reflète (en partie) la façon dont les enfants apprennent leur langue.

Weaving an ambiguous lexicon

Construire un lexique ambigu

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager