S2 — L'espace sémantique dans le cerveau

▶ Écouter ce chapitre (≈ 15–20 min)
schéma

Au chapitre précédent, on a vu les machines transformer le sens en géométrie. La question qui s'impose maintenant est vertigineuse : et nous ? Quand tu comprends le mot « chien », est-ce que ton cerveau, lui aussi, place ce sens quelque part, dans une sorte d'espace neuronal ? La réponse courte, que les vingt dernières années de neurosciences ont rendue de plus en plus solide, est : oui, probablement, et d'une manière qui ressemble étrangement à ce que font les machines. Ce chapitre raconte cette convergence, en s'appuyant sur les travaux dont Stanislas Dehaene parle au Collège de France, mais aussi sur d'autres équipes qui ont fait des découvertes décisives.

Le sens est étalé sur tout le cortex : les cartes sémantiques

Commençons par une expérience devenue un classique. En 2016, l'équipe d'Alexander Huth et Jack Gallant, à Berkeley, publie dans la revue Nature un résultat saisissant. Des volontaires écoutent, pendant des heures, des histoires racontées, allongés dans un appareil d'imagerie par résonance magnétique, l'IRMf, qui mesure l'activité du cerveau zone par zone. Les chercheurs notent, pour chaque petit volume de cortex, à quels mots et à quels thèmes cette zone réagit le plus.

Ce qu'ils obtiennent, c'est une carte. Une carte sémantique du cerveau. Et cette carte révèle deux choses importantes. Premièrement, le sens des mots n'est pas concentré dans un petit centre du langage, comme on l'a longtemps cru. Il est étalé sur une vaste étendue du cortex, dans les deux hémisphères, des dizaines de régions qui répondent chacune à des familles de concepts. Une zone s'allume pour les mots qui touchent aux personnes et aux relations sociales ; une autre pour les nombres et les quantités ; une autre pour les lieux et les déplacements ; une autre pour les parties du corps. Le sens est une géographie.

Deuxièmement, et c'est le point crucial pour notre histoire, cette géographie est continue et organisée. Les concepts proches de sens sont représentés par des zones proches sur le cortex, et les transitions sont graduelles. On passe doucement du domaine du visuel au domaine du tactile, du concret à l'abstrait. Autrement dit, le cerveau ne range pas les concepts dans des tiroirs séparés ; il les dispose sur une surface continue où le voisinage spatial reflète la parenté de sens. Ça ne te rappelle rien ? C'est exactement le principe de l'espace sémantique du chapitre un. Le cerveau, comme la machine, fait de la proximité de sens une proximité spatiale — sauf qu'ici l'espace est physiquement réalisé dans la chair du cortex.

Naviguer dans les idées comme dans l'espace : les cellules de grille

La deuxième grande découverte est encore plus surprenante, et c'est celle qui a probablement le plus retenu l'attention de Dehaene, parce qu'elle suggère un mécanisme. Elle vient de l'étude d'une fonction qui n'a rien à voir, en apparence, avec le langage : l'orientation dans l'espace physique.

Dans les années deux mille, May-Britt et Edvard Moser découvrent, dans une région du cerveau appelée le cortex entorhinal, des neurones extraordinaires : les cellules de grille. Quand un rat se déplace dans une pièce, ces cellules s'activent selon un motif régulier, en triangles, comme si le cerveau plaquait sur le sol un quadrillage invisible pour savoir où l'animal se trouve. C'est un système de coordonnées interne, une sorte de GPS neuronal. La découverte vaut à ses auteurs le prix Nobel de médecine en 2014. Jusque-là, on pense que ces cellules servent uniquement à se repérer dans l'espace physique.

Puis vient le retournement. Dans les années qui suivent, plusieurs équipes — notamment celle de Tim Behrens à Oxford — montrent que ce même système de coordonnées sert aussi à naviguer dans des espaces abstraits. Dans une expérience devenue célèbre, des humains apprennent des relations entre des objets — par exemple des oiseaux dont le cou et les pattes varient continûment. Ces relations forment, mathématiquement, un espace à deux dimensions. Et l'imagerie montre que le cerveau utilise ses cellules de grille, son GPS, pour se déplacer dans cet espace conceptuel, exactement comme il le ferait dans une pièce. Behrens et ses collègues théorisent ça sous le nom de machine de Tolman-Eichenbaum : un même mécanisme de cartographie, capable de représenter aussi bien l'espace physique que l'espace des concepts, des relations sociales, des séquences abstraites.

L'implication est profonde, et c'est là que Dehaene insiste dans ses cours. Le cerveau ne fabrique pas un mécanisme spécial pour chaque type de connaissance. Il réutilise un dispositif géométrique général — fait pour s'orienter dans l'espace — et l'applique à la pensée abstraite. Penser, ce serait en partie se déplacer. Comprendre une analogie, ce serait faire le même trajet dans deux régions différentes de l'espace conceptuel. La métaphore spatiale que nos langues emploient partout — « être proche d'une idée », « un raisonnement qui ne mène nulle part », « un esprit ouvert » — ne serait peut-être pas qu'une métaphore. Elle refléterait l'architecture réelle de la cognition.

Dehaene : le code neural des concepts et ses limites

Stanislas Dehaene, titulaire de la chaire de psychologie cognitive expérimentale au Collège de France, rassemble ces fils dans une vision plus large. Son programme de recherche, depuis des décennies, consiste à chercher comment des grandeurs mentales — les nombres, l'espace, le temps, les concepts — sont codées par des populations de neurones. Trois idées de Dehaene importent ici, et je vais essayer de les rendre fidèlement, sans les durcir.

Première idée : il existe un code neural géométrique pour les concepts. Pour les nombres, Dehaene a montré de longue date l'existence d'une « ligne numérique mentale » : nous représentons les quantités sur un axe interne, orienté, où les petits nombres sont d'un côté et les grands de l'autre, avec une précision qui décroît à mesure que les nombres grandissent. Cette ligne numérique est un premier exemple d'espace sémantique cérébral, très simple, à une dimension. Dehaene généralise : beaucoup de nos concepts seraient organisés sur des axes, des cartes, des espaces de faible dimension où la position code le sens.

Deuxième idée : le cerveau possède quelque chose comme un langage de la pensée, mais ce langage a une dimension géométrique. Dehaene s'intéresse à la manière dont nous combinons des concepts pour en former de nouveaux, dont nous représentons des structures — des séquences, des arbres, des règles. Il défend l'idée que l'humain dispose d'une capacité, peut-être propre à notre espèce, à manipuler des structures symboliques imbriquées, une sorte de grammaire mentale qui dépasse la simple géométrie associative. C'est un point important, et un point de tension avec les machines, sur lequel je reviens dans une minute.

Troisième idée, qui est une mise en garde : Dehaene ne dit pas que le cerveau est un grand modèle de langage. Il insiste, au contraire, sur ce que les réseaux actuels ne capturent pas. Notre cerveau apprend avec très peu d'exemples, là où les machines en exigent des milliards. Il sait représenter des règles explicites, abstraites, et les appliquer à des cas entièrement nouveaux. Il distingue ce qu'il sait de ce qu'il ignore. Pour Dehaene, la géométrie sémantique est un étage réel et important de la cognition, mais elle est surmontée par un étage symbolique, combinatoire, dont l'humain semble particulièrement bien doté et dont on ne sait pas encore s'il émerge naturellement de la géométrie ou s'il relève d'autre chose. Cette prudence est précieuse : elle nous garde de l'enthousiasme facile qui voudrait que cerveau et machine soient déjà la même chose.

La convergence troublante : les embeddings prédisent le cerveau

Reste le fait le plus déconcertant, celui qui donne à toute cette histoire son tranchant. Quand on compare directement les espaces sémantiques des machines et l'activité du cerveau humain, ils correspondent. Pas vaguement : mesurablement.

Voici le type d'expérience. On fait lire ou écouter des phrases à une personne pendant qu'on enregistre son activité cérébrale. En parallèle, on donne les mêmes phrases à un grand modèle de langage et on récupère ses embeddings, les positions dans son espace sémantique. Puis on demande : peut-on prédire l'activité du cerveau humain à partir des embeddings de la machine ? La réponse, retrouvée par de nombreuses équipes depuis 2018 — celles de Jean-Rémi King, d'Evelina Fedorenko, d'Uri Hasson notamment — est oui, et bien mieux qu'avec les modèles précédents. Les régions de l'espace de la machine s'alignent, par une transformation simple, sur les régions du cortex sémantique. Mieux encore, les modèles les plus performants en langage sont aussi ceux qui prédisent le mieux le cerveau. Comme si progresser vers un meilleur modèle du langage rapprochait, involontairement, de l'organisation du cerveau.

Comment interpréter cette convergence ? Deux lectures s'affrontent, et il faut tenir les deux. La lecture forte dit : si deux systèmes très différents — un cerveau biologique et un réseau artificiel — aboutissent à la même organisation géométrique du sens, c'est peut-être qu'il n'existe qu'une bonne façon d'organiser le sens, dictée par la structure du langage et du monde. La géométrie sémantique serait une découverte, pas une invention ; une propriété du problème, que tout système assez bon finit par trouver. La lecture prudente répond : attention, l'alignement peut être en partie un artefact. Les deux systèmes sont entraînés sur le même langage humain, donc ils en héritent les mêmes régularités statistiques ; la correspondance pourrait être plus superficielle qu'il n'y paraît, et ne rien dire des mécanismes profonds, qui restent peut-être très différents. La vérité est sans doute entre les deux, et c'est un front de recherche actif. Mais même la lecture prudente laisse intact le fait brut : il y a là une correspondance réelle, robuste, reproductible, entre la géométrie du sens dans les machines et dans nos têtes.

Ce que ça change pour la suite

Faisons le point avant de descendre, au chapitre suivant, à l'intérieur même de l'espace d'un modèle. Trois acquis.

Le cerveau organise le sens géométriquement. Les cartes sémantiques de Huth montrent un sens étalé sur le cortex, disposé de façon continue où le voisinage spatial reflète la parenté conceptuelle. Ce n'est plus une métaphore : c'est une géographie mesurée.

Ce codage géométrique réutilise un mécanisme de navigation. Les cellules de grille, faites pour s'orienter dans l'espace physique, servent aussi à se déplacer dans les espaces abstraits. Penser ressemble, au moins en partie, à se déplacer dans un espace de concepts — ce qui donne une assise neuronale à toute notre histoire.

Mais la géométrie ne fait pas tout. Dehaene rappelle qu'au-dessus de l'espace sémantique, l'humain dispose d'un étage symbolique et combinatoire — la capacité de représenter des règles, des structures imbriquées, et de les appliquer à du neuf avec une frugalité d'exemples que les machines n'ont pas. Cette tension entre la géométrie et le symbole, entre l'association et la règle, est le fil rouge qui va nous mener, au dernier chapitre, à la question de David : que peut-on vraiment attendre de l'espace sémantique pour le calcul, le raisonnement, l'abduction ?

Avant ça, il faut regarder l'espace de plus près. Car jusqu'ici je t'ai dit « le sens est une position dans l'espace » comme si c'était simple et propre. Au chapitre trois, on va voir que cet espace est en réalité un objet étrange, comprimé, où des milliers de concepts se cachent dans bien moins de dimensions qu'il n'en faudrait — et comment les chercheurs d'Anthropic ont commencé, littéralement, à le lire.