La loi des mots et les "World models"
La loi des mots
1. Je sens que cet article va être encore plus court que d’habitude, car la loi énoncée par David Kaplan est simple : If a word isn’t working for you, it’s working against you (si un mot ne travaille pas pour vous, il travaille contre vous.)
2. Dans un texte, il faudrait donc enlever tous les mots qui ne servent à rien, voire juste à faire joli ou “important”, si l’on ne veut pas nuire à la bonne compréhension d’un message (combien de mots à enlever dans cette phrase ?). Premières victimes : les adverbes, les périphrases, le jargon…
3. Car un message court est plus lisible et compréhensible. Trop de mots noient le message et le tuent.
Less is more
Mies van Rohe
4. La déclinaison de ce besoin va au-delà de la phrase car, de la même façon, les mots courts ont plus d’impact que les mots longs. Notre cerveau, ce fainéant, préfère les messages faciles à décoder : un mot court (1 à 2 syllabes) est traité plus vite, avec moins d’effort, et sera mieux mémorisé. Il aura aussi un impact plus fort car il a le pouvoir de provoquer une émotion immédiate. C’est pourquoi les slogans efficaces utilisent presque toujours des mots courts. Quelques exemples :
Just do it
Think big
Parce que vous le valez bien
5. Et alors, que deviennent les mots longs, complexes ou techniques qui demandent une interprétation par nos cerveaux fatigués ? S’ils ralentissent la lecture, ils permettent aussi, dans une alternance bien pensée, de donner plus de nuances à un texte, de préciser l’émotion ou l’information que l’on veut faire passer.
6. Difficile de faire clair et court du premier coup : la première version d’un texte comporte toujours trop de mots inutiles qu’il faut au fil des versions élaguer pour ne garder que les mots essentiels. Toujours cette citation de Blaise Pascal dont je ne me lasse pas : “Je n’ai fait cette lettre-ci plus longue que parce que je n’ai pas eu le loisir de la faire plus courte”.
7. Oups, j’allais oublier… Qui est l’auteur de cette “loi” ? Il s’agit de David Kaplan, un philosophe et logicien américain né en 1932, longtemps professeur à UCLA, la grande université de Los Angeles. Ses recherches ont porté sur la philosophie du langage et notamment sur l’analyse de la sémantique des indexicaux et des démonstratifs. Parmi ses publications se trouve l’article qui nous intéresse aujourd’hui : “Words” paru dans “The Aristotelian Society, Supplementary Volume, LXIV” en 1990.
La leçon du jour
C’est la même histoire quel que soit le domaine quand on y réfléchit bien. Prenons l’exemple de l’endroit où vous vivez ou travaillez. Si un objet ou un meuble ne “travaille” pas pour vous, il “travaille” contre vous. S’il ne remplit pas une fonction précise ou ne vous apporte pas une réelle satisfaction émotionnelle, il encombre votre espace ou votre esprit. Idem pour les gens ? Si une personne ne vous apporte ni une action (aller courir ensemble, partir en voyage…), ni une forme de bonheur, peut-être qu’il vaut mieux l’éliminer (je plaisante…).
Pour aller plus loin
David Kaplan in his 1990 paper “Words,” and John Hawthorne - 2011, The Journal of Philosophy Inc.
Les World models
1. Les World models constituent une nouvelle génération d’intelligence artificielle, celle des systèmes capables d’interpréter notre environnement physique. À la différence des outils conversationnels du type ChatGPT, les World models cherchent à comprendre le monde physique dans lequel nous vivons.
2. Au lieu de s’entraîner en ingurgitant des milliards de textes, les World Models se nourrissent d’images, de vidéos ou d’actions effectuées par des robots. Cette matière brute leur permet de simuler des situations (« si je fais ça, que va-t-il se passer ? ») et d’établir des prévisions.
3. Ces modèles suscitent un engouement croissant, comme l’indique le virage pris par Yann Le Cun qui, après une dizaine d’années à la tête de la recherche en intelligence artificielle de Meta (Facebook, Instagram et Whatsapp), choisit de fonder sa propre entreprise dédiée aux World models. Même mouvement pour la chercheuse américaine Fei-Fei Li, autre star mondiale de l’IA, qui a récemment fondé World Labs, spécialisée dans la création de mondes virtuels en 3D.
4. Les World models s’avèrent très précieux dans les domaines où il faut se projeter dans le réel :
la robotique (se préparer au mouvement suivant)
les jeux vidéos (prédire les actions des joueurs)
les véhicules autonomes (anticiper les comportements sur la route)
Bref, partout où les actions comptent davantage que les mots.
5. Les LLM (Large language models) conçus pour comprendre et générer des textes en langage humain et les World models ne sont pas concurrents mais complémentaires. Ensemble, ils élargissent le champ des possibles en IA.
Quelques avantages et inconvénients :
Les LLM “travaillent” sur les mots, les World models anticipent l’état futur d’une situation.
Les LLM génèrent des échanges en langage naturel, les World models interagissent au sein d’un environnement réel.
Les LLM ne peuvent pas prendre de décisions ancrées dans le monde physique, les World models sont moins performants en langage, sont plus coûteux à entraîner et sont dépendants de données environnementales encore limitées.
6. Les géants de la tech dont Nvidia qui en a fait son cheval de bataille, se mobilisent pour financer ce marché. Le leader mondial des cartes graphiques estime que les World models devraient représenter un marché de 100 000 milliards de dollars, soit à peu près le montant de l’économie mondiale actuelle. Un détail…
7. En venant voler la vedette aux LLM, les World models montrent que le futur de l’IA réside dans la fusion de ces deux approches, par exemple sous la forme d’un robot qui raisonne avec un LLM et qui anticipe ses actions grâce à un World model… ce qui ressemble beaucoup à un humain. Et dire qu’on avait déjà le modèle en magasin !
La leçon à tirer
LLM + World Models = la tête et les jambes de l’IA


