OUDEYER Pierre-Yves

PhD student at Sorbonne University - OASIS
https://lip6.fr/Pierre-Yves.Oudeyer

Supervision : Jean-Pierre BRIOT

Co-supervision : STEELS Luc

L'auto-organisation de la parole

mots-clés : origine de la parole, auto-organisation, évolution, formes, systèmes artificiels, agents, phonétique, phonologie, exaptation
Les humains ont un système de vocalisations complexe. Celles-ci sont digitales et compositionnelles : elles sont construites à partir de la re-combinaison d'unités qui sont systématiquement ré-utilisées dans les vocalisations. Ces unités sont présentes à plusieurs niveaux (e.g. les gestes, les coordinations de gestes ou phonèmes, les morphèmes). Alors que l'espace articulatoire qui définit l'espace des gestes est continu, chaque langue discrétise cet espace à sa manière. Alors qu'il y a une grande diversité dans l'ensemble des répertoires de ces unités dans les langues du monde, il y a en même temps de fortes régularités (par exemple, la fréquence élevée du système à cinq voyelles /e,i,o,a,u/). La manière dont les unités sont combinées est aussi très particulière : 1) toutes les séquences de phonèmes ne sont pas autorisées dans une langue donnée, 2) l'ensemble des combinaisons de phonèmes est organisé en patterns. Cette organisation en pattern veut dire que par exemple, on peut résumer les combinaisons de phonèmes en Japonais par le pattern "CV" : une syllabe doit être composée de deux emplacements, et dans le premier emplacement seuls les phonèmes de la catégorie que l'on appelle "consonnes" sont autorisés, alors que dans le second emplacement seuls les phonèmes de la catégorie "voyelles" sont autorisés.
Il est ainsi naturel de se demander d'où vient cette organisation. Deux types de réponses doivent être apportés. Le premier type est une réponse fonctionnelle : il établit la fonction des systèmes sonores, et montre que les systèmes qui ont l'organisation que nous avons décrite sont efficaces pour remplir cette fonction. Cela a par exemple été proposé par Lindblom qui a montré que les régularités statistiques des répertoires de phonèmes pouvaient être prédites en recherchant quels étaient les systèmes de vocalisations les plus efficaces. Ce type de réponse est nécessaire, mais non suffisant : il ne permet pas d'expliquer comment l'évolution (génétique ou culturelle) pourrait avoir trouvé cette structure optimale. En particulier, il se peut que la recherche darwinienne "naïve" avec des mutations aléatoires se révèle pas suffisamment efficace pour trouver des structures complexes comme celles de la parole : l'espace de recherche est trop grand. C'est pourquoi un second type de réponse est nécessaire : il faut aussi établir comment la sélection naturelle a pu trouver ces structures. On peut pour cela montrer comment l'auto-organisation a pu contraindre l'espace de recherche et aidé la sélection naturelle. Cela peut être fait en montrant qu'un système beaucoup plus simple s'auto-organise spontanément en formant la structure que l'on cherche à expliquer.
Nous présentons dans cette thèse un système artificiel de ce type. Nous utilisons la méthodologie de l'artificiel, qui consiste à construire une société d'agents formels dans une logique d'abduction. Cela ne permet pas de montrer directement quels furent les mécanismes qui ont formé la parole humaine, mais permet de savoir quels types de mécanismes sont des candidats plausibles. La construction de ce système artificiel apporte des contraintes à l'espace de recherche des réponses possibles, en particulier en montrant des exemples de mécanismes suffisants, et des exemples de mécanismes qui ne sont pas nécessaires.
Techniquement, le système artificiel est basé sur le couplage de dispositifs nerveux sensori-moteurs génériques qui sont câblés aléatoirement au départ et implémentés dans la tète d'agents artificiels. Nous montrons comment ce système s'auto-organise de manière à ce que les agents développent des systèmes de vocalisations partagés par une même communauté, et qui sont digitaux, compositionnels, et caractérisés par des régularités statistiques. De plus, nous montrons comment ces systèmes font apparaître des règles phonotactiques et une organisation en patterns des combinaisons des phonèmes qui sont partagées par une même communauté d'agents et différentes dans des communautés différentes.
Le type de mécanisme de ce système apparaît comme un complément nécessaire à l'explication fonctionnelle. En outre, il ne requiert pas la présence explicite de pression fonctionnelle pour une communication efficace. Il ne requiert aucune pression sociale et les agents n'ont en fait aucune capacité sociale. Alors que les codes de la parole contemporains sont évidemment influencé par la fonction de communication qu'ils remplissent, cette simplicité du système artificiel permet de proposer une nouvelle hypothèse en ce qui concerne l'invention initiale de systèmes de vocalisations partagés : ils pourraient être des effets collateraux auto-organisés de certaines structures cérébrales qui ont sont apparues chez l'homme sous l'influence de fonctions qui n'ont rien à voir avec la communication. Nous développerons cette hypothèse en expliquant quelles sont ces structures cérébrales et quelle était leur fonction initiale.

Defence : 11/24/2003

Jury members :

BRIOT Jean-Pierre, (UPMC/LIP6) [Co-Directeur]
DROGOUL Alexis (UPMC/LIP6) [Examinateur]
GOLDSTEIN Louis [Examinateur]
HURFORD James [Rapporteur]
STEELS Luc (Sony CSL-Paris) [Co-Directeur]
STUDDERT-KENNEDY Michael (Haskins Labs, USA) [Rapporteur]

Departure date : 11/25/2003

2003 Publications