Thèse dirigée par Daniel Hirst, soutenue à l’université de Provence le 3 décembre 2004.
Ce travail s’inscrit dans la thématique plus large de la prédiction de l’organisation temporelle de l’anglais. Les deux problématiques ici abordées sont la définition des unités rythmiques et l’ambisyllabicité en anglais britannique. Ces problématiques sont testées dans la base de données
Aix-Marsec, un corpus d’anglais britannique de plus de cinq heures de parole authentique. Nous avons au préalable effectué un certain nombre de traitements automatiques comme la phonétisation du corpus (phonétisation par extraction automatique du lexique, puis optimisation de cette phonétisation par application de onze règles d’élision de phonèmes). Le corpus a ensuite été aligné temporellement aux niveaux des phonèmes (par application de l’algorithme de Viterbi) puis des constituants syllabiques, des syllabes, des pieds accentuels, des NRU, des mots et des unités intonatives mineures et majeures.
Deux modèles rythmiques sont ici comparés et évalués, celui de Jassem et celui d’Abercrombie. L’unité généralement choisie est le pied accentuel (modèles d’Abercrombie) : un pied débute avec une syllabe accentuée et englobe toutes les syllabes inaccentuées suivantes jusqu’à la syllabe
accentuée suivante (mais sans l’inclure) ou jusqu’à la frontière d’unité intonative suivante. Un autre modèle supra-syllabique a également été proposé plusieurs années auparavant (Jassem) dont la différence réside dans la délimitation des unités rythmiques. Dans ce modèle, l’unité rythmique débute également avec une syllabe accentuée mais englobe toutes les syllabes inaccentuées suivantes jusqu’à la frontière de mot ; cette unité est l’unité rythmique étroite (Narrow Rhythm Unit ou NRU). Les syllabes inaccentuées restantes appartiennent à l’anacrouse dont la particularité est d’être prononcée très rapidement. La différence entre les deux modèles réside par conséquent dans la prise en compte de la présence des frontières de mot. Les deux modèles prédisent que les
unités rythmiques (le pied et la NRU) ont une durée voisine quel que soit le nombre de sousconstituants, ceci correspondant au concept d’isochronie faible, contrairement au concept d’isochronie stricte selon lequel la durée des unités rythmiques est constante quel que soit le nombre de sous-constituants. De plus, les deux modèles font comme prédiction que les syllabes comprises dans les pieds et les NRU se répartissent la durée de l’unité rythmique de manière égale quel que soit leur statut accentuel. Ceci implique une absence d’effet allongeant de l’accent, contrairement aux différentes études présentes dans la littérature selon lesquelles l’accent influence la durée des syllabes/phonèmes de manière significative.
L’évaluation et la comparaison de ces deux modèles représentent la première problématique de ce travail, le but étant de déterminer lequel de ces deux modèles représente mieux la structuration rythmique de l’anglais britannique. La deuxième problématique de ce travail concerne la syllabification des consonnes intervocaliques en anglais ou plus précisément le phénomène d’ambisyllabicité. On trouve dans la littérature un ensemble d’arguments en faveur ou défaveur de l’ambisyllabicité mais il n’existe à notre connaissance aucun travail expérimental visant à tester ce principe sur de la parole naturelle. Or, il semble fondamental de se poser cette question puisque le découpage syllabique est nécessaire dans le cadre d’une approche prédictive de l’organisation temporelle. L’évaluation et la comparaison des deux modèles rythmiques de Jassem et d’Abercrombie se font en fonction de trois hypothèses : l’isochronie stricte, l’isochronie faible et l’effet de l’accent sur la durée des sous-constituants (syllabes, phonèmes). Les hypothèses d’isochronie stricte et d’isochronie faible sont testées à différents niveaux de représentation, à savoir la syllabe, l’unité
rythmique étroite (Jassem), le pied accentuel (Abercrombie), le mot et l’unité intonative. Les résultats statistiques ne révèlent aucune isochronie stricte, quelle que soit l’unité observée : les unités n’ont pas toutes une durée constante quel que soit le nombre de sous-constituants. Ce résultat n’est pas surprenant et il rejoint les différentes études portant sur l’isochronie stricte en anglais. En revanche, il semble exister une tendance vers l’isochronie faible puisqu’on observe un certain degré de compression des sous-constituants dans toutes les unités observées, sauf au niveau de la syllabe. En effet, il ressort qu’il n’y a aucune compression des phonèmes dans le cadre de la syllabe et par conséquent la durée de celle-ci augmente quasi linéairement en fonction de sa complexité. En ce qui concerne les unités rythmiques, on observe deux fois plus de compression
dans les unités rythmiques étroites que dans les pieds accentuels. De plus, il semble y avoir une très
faible compression des phonèmes dans l’anacrouse. Ces deux résultats semblent montrer la
nécessité de distinguer l’unité rythmique étroite et l’anacrouse, alors que ces deux unités sont
regroupées dans le pied accentuel dans le modèle d’Abercrombie. La troisième hypothèse concerne
l’effet de l’accent sur la durée des sous-constituants. Dans la totalité des données et dans le cadre
du pied, l’effet de l’accent sur la durée des phonèmes est très significatif. En revanche, si on limite
l’analyse aux unités rythmiques étroites, l’effet de l’accent ressort comme non-significatif. Ce
résultat est surprenant mais il semble montrer que c’est l’appartenance à la NRU plutôt que
l’accent qui influence la durée des sous-constituants. Il semble donc que le modèle de Jassem
permette une meilleure représentation de la structuration rythmique de l’anglais britannique.
La question de l’ambisyllabicité est ensuite abordée dans un premier temps grâce à des tests
statistiques dans la base de données Aix-Marsec. Les consonnes intervocaliques à l’intérieur des mots sont doublement annotées, tout d’abord en tant qu’attaques selon le principe d’attaque
maximale puis ambisyllabiques selon le principe d’ambisyllabicité- ; les codages sont effectués en
respectant les contraintes phonotactiques de cooccurrence de l’anglais. Il ne semble pas y avoir de
différence significative entre la durée des consonnes ambisyllabiques et celle des attaques, ce
résultat présente donc une preuve allant à l’encontre du principe d’ambisyllabicité. En revanche, on
observe une différence très significative entre la durée des voyelles précédant les consonnes
ambisyllabiques et la durée de celles précédant les codas. Nous obtenons par conséquent des
résultats intermédiaires qui nécessiteraient des tests supplémentaires avant de pouvoir tirer une
conclusion tranchée, notamment en tenant compte de la nature des phonèmes concernés.
Ces résultats sont ensuite complétés par une expérience en production au cours de laquelle on
incite implicitement 14 locuteurs anglophones natifs à découper une série de phrases en syllabes.
Dans ces découpages, environ 84 % des consonnes intervocaliques sont syllabifiées en attaques de syllabes suivantes, 13 % en codas de syllabes précédentes et 3% des consonnes sont
ambisyllabiques. Ces résultats montrent que, même si les regroupements codaïques et
ambisyllabiques ne sont pas totalement absents du système phonologique de l’anglais britannique, les regroupements en attaque sont largement prééminents. Toutefois, il ressort des résultats une part importante de variabilité intra et inter-individuelle puisque aucun des locuteurs ne syllabifie selon une seule et unique façon et les types de syllabification varient d’un locuteur à l’autre. À partir des 13 % de regroupements codaïques et des 3 % de regroupements ambisyllabiques, nous avons testé l’effet d’un ensemble de facteurs (Treiman & Danis, 1988) sur l’apparition de telles consonnes, à savoir la nature et la complexité orthographique de la consonne intervocalique, la nature de la voyelle précédente et le patron accentuel. Il ressort que ces facteurs ont tous un effet significatif sur l’apparition des regroupements codaïques et ambisyllabiques, mais dans des proportions et des tendances différentes selon le type de regroupement. Par exemple, les consonnes ambisyllabiques sont plutôt des sonorantes orthographiquement doubles alors que les consonnes codaïques correspondent plutôt à des consonnes orthographiques simples avec des proportions voisines concernant les sonorantes et les obstruantes. Les deux types de consonnes se retrouvent en grande majorité après une syllabe accentuée, notamment si celle-ci possède une voyelle courte. On retrouve donc ici l’argument principal en faveur des syllabifications codaïques ou ambisyllabiques, à savoir l’impossibilité en anglais d’avoir des syllabes accentuées ouvertes avec une voyelle courte.
Mots-clés : Aix-Marsec, ambisyllabicité, anacrouse, isochronie, unité rythmique étroite, prosodie, rythme, pied accentuel.
RHYTHM AND PROSODIC STRUCTURE IN CONTEMPORARY BRITISH ENGLISH
The two questions which are addressed in this work are the definition of rhythmic units and the
question of ambisyllabicity in British English, these being closely related to the more general
question of the prediction of speech timing. The questions of ambisyllabicity and definition of the
rhythmic units are tested on Aix-Marsec, a large prosodically annotated database of authentic
speech which is temporally aligned at different levels of representation. Two rhythmic models are
here evaluated, that of Jassem and that of Abercrombie, both differing in the definition of the
rhythmic units and in the role of word boundaries. The statistical results show that there is no
evidence of strict isochrony : units are not of equal duration whatever the number of subconstituents there are. However, there seems to be a tendency towards weak isochrony as some degree of compression is observed in stress feet and in NRUs (Narrow Rhythm Units), even more so in NRUs, which seems to show that Jassem’s model gives a better representation of English
rhythm. Besides, stress does not seem to have a lengthening effect on the duration of phonemes
belonging to NRUs, which is surprising as stressed phonemes are generally said to be lengthened.
The question of syllabification is then addressed through some statistical tests on the Aix-Marsec
database. It seems that there is no significant difference between ambisyllabic and onset
consonants in terms of duration ; there is, however, a difference between vowels preceding an
ambisyllabic consonant and those preceding a coda. These results are completed by a production
test during which 14 native speakers are implicitly asked to split up a set of sentences into syllables.
84 % of the intervocalic consonants are onsets, only 13 % are codas and 3 % ambisyllabic
consonants. It therefore seems that ambisyllabicity is not an intrinsic characteristic of the
phonological system of British English. It is also observed that the production of ambisyllabic and
coda consonants is significantly influenced by the nature and the orthographic complexity of the
intervocalic consonant, the nature of the preceding vowel and the stress pattern (Treiman &
Danis, 1988).
Keywords : Aix-Marsec, ambisyllabicity, anacrusis, isochrony, Narrow Rhythm Unit, prosody, rhythm, stress foot.
Cette thèse est téléchargeable ici