À quelle fréquence utilisez-vous le mot « tapisserie » dans votre langage courant ? Et « delve » ? Le mot « testament » apparaît-il régulièrement dans vos textes ?
Beaucoup d'entre nous diraient probablement non, et pour cause. Ces mots n'ont pas réussi à figurer dans la liste des « 500 mots anglais les plus populaires ». En réalité, ils n'ont probablement pas non plus atteint le top 1 000.
Pourtant, ces termes ont récemment connu une forte augmentation dans les contenus écrits. Par exemple, le Dr Jeremy Nguyen a mené une étude en mars 2024, où il a constaté que 0,5 % des articles publiés sur le site de recherche PubMed contenaient le mot « delve ». Comparez ce chiffre à celui de 2022, lorsque ce chiffre était inférieur à 0,1 %.

Alors, qu'est-ce qui a changé au cours de ces 15 mois ? Pourquoi cette soudaine augmentation du nombre d'universitaires utilisant ce terme ?
ChatGPT est sorti en novembre 2022. Nous découvrons maintenant que ChatGPT privilégie certains mots, notamment (vous l'aurez deviné) « delve », « tapestry » et « testament ».
Cela a été un signal d’alarme pour les passionnés de langues du monde entier.
Comment se fait-il que ChatGPT ait choisi ces mots apparemment aléatoires comme favoris ? Et surtout, avec son ascension rapide, l'intelligence artificielle (IA) aura-t-elle le pouvoir de façonner notre langage vernaculaire dans un avenir proche ?
Il semble que la réponse soit (ironiquement) très humaine.

L'IA dans notre vie quotidienne
Bien que l’IA semble à beaucoup comme une nouvelle technologie apparue du jour au lendemain, elle existe de manière subtile depuis des années.
La reconnaissance faciale qui ouvre votre téléphone ? C'est une forme d'IA .
Netflix vous recommande de regarder Peaky Blinders après avoir terminé Breaking Bad ? Un autre type d'IA.
Ce chatbot qui vous demande vos symptômes avant d'envoyer un message à votre médecin ? Un exemple d'IA.
Cependant, il ne s'agissait pas d'exemples de l'IA stéréotypée que beaucoup d'entre nous imaginent aujourd'hui. Il s'agissait de petits systèmes qui nous aidaient à peaufiner une technologie déjà fonctionnelle (notre téléphone, notre application de streaming, notre portail de santé).
Ce n'est que récemment que nous avons été confrontés à un nouveau type d'intelligence artificielle capable de penser par elle-même, sous la forme d'une IA générative, comme ChatGPT d'OpenAI.
Mais ces technologies ne pensent pas réellement par elles-mêmes. Au lieu de cela, elles analysent une quantité extraordinaire d'informations – l'équivalent de millions de livres – et utilisent ces données pour produire des réponses à nos questions.
Pourtant, l'IA ne comprend pas vraiment ce qu'elle nous dit. Kem-Laurin Lubin, Ph. D., a créé une métaphore utile pour expliquer ce concept :
Chez OpenAI, on n'a pas été assez naïf pour envoyer un chef novice à l'aveuglette. Au lieu de cela, ils ont recours à des humains pour coacher leurs futurs cuisiniers et leur indiquer les plats – autrement dit, les lignes de texte – qui leur semblent les plus appétissants.

Les personnes derrière le lexique de l'IA
Le processus d'évaluation des réponses élaborées par l'IA s'appelle l'apprentissage par renforcement à partir du feedback humain (RLHF). Voici notre premier indice expliquant pourquoi ChatGPT s'appuie autant sur certains termes.
Il est coûteux d'employer une armée de testeurs pour évaluer les réponses potentiellement infinies de l'IA. C'est pourquoi (et c'est souvent le cas) les entreprises externalisent ces tâches vers des pays à faible revenu. Dans ces pays, l'anglais est souvent une seconde langue.
Il est courant que les locuteurs non natifs aient un langage plus formel, car l'argot n'est généralement pas enseigné dans les cours de langues. (C'est pourquoi votre espagnol du lycée sonne un peu bizarre en Espagne.)
Certains domaines sont également associés à des termes spécifiques. C'est pourquoi une même pièce est appelée « toilettes » au Canada, « salle de bain » aux États-Unis et « toilettes » en Grande-Bretagne.
Tous ces facteurs s’entremêlent car les anglophones non natifs parlent la langue plus fréquemment, ce qui conduit chaque nation à développer sa propre version de la liste des « 500 mots anglais les plus populaires ».
Tous ces facteurs s’entremêlent car les anglophones non natifs parlent la langue plus fréquemment, ce qui conduit chaque nation à développer sa propre version de la liste des « 500 mots anglais les plus populaires ».
Lorsqu'on analyse les préférences en anglais des pays généralement ciblés pour la main-d'œuvre bon marché, on tombe sur le Nigéria. En anglais nigérian, « delve » est un mot assez courant dans le langage professionnel.
Par conséquent, lorsque les testeurs nigérians indiquent à ChatGPT quelles réponses leur semblent authentiques, ils privilégient les réponses contenant des mots qu'ils utilisent habituellement, comme « delve ».
Et voilà : le mystère de la montée en puissance de ces mots a une réponse logique. Et cela soulève la question suivante :
À mesure que nous utilisons davantage l’IA et consommons plus fréquemment du contenu écrit par l’IA, ces mots privilégiés par l’IA deviendront-ils progressivement plus répandus dans les lexiques des anglophones natifs ?
En fin de compte, cela remet en question l’évolution du langage lui-même.

La progression naturelle du langage : IA ou pas
D'une certaine manière, l'IA a déjà influencé notre langage. Ces dernières années, nous avons ajouté des termes comme « grand modèle de langage » (LLM), « intelligence artificielle générative » (GenAI) et « GPT » (dont le nom complet est « Generative Pre-training Transformer ») à nos dictionnaires.
Mais ce phénomène n'est pas propre à l'IA. Chaque boom technologique a apporté son lot de nouveaux mots, et en a entraîné la disparition. On ne dit plus qu'il faut « enregistrer » quelque chose (en référence à l'enregistrement d'une émission) car :
A) Peu de gens enregistrent des émissions à l’ère des services de streaming
B) plus personne n'utilise de cassettes VHS
Parallèlement, d'autres expressions ont tendance à perdurer. Nous n'avons plus besoin de raccrocher physiquement notre téléphone pour mettre fin à un appel, mais la plupart d'entre nous continuent de dire que nous allons « raccrocher ».
Notre vocabulaire est également influencé par l'actualité. L'expression « distanciation sociale » est devenue courante pendant la pandémie de COVID-19, même si personne ne l'utilisait avant 2020.
La culture pop et les réseaux sociaux jouent également un rôle important dans notre vocabulaire. « Rizz » est entré dans notre vocabulaire en 2023, après que le YouTubeur et utilisateur de Twitch Kai Cenat l'a inventé. Si vous n'êtes pas à la mode auprès des jeunes, « rizz » fait référence au charisme ou à l'assurance d'une personne. (Oui, je me suis sentie vieille en écrivant ça.)
Le fait est que nous adoptons constamment de nouvelles expressions et actualisons notre jargon. La fréquence à laquelle nous utilisons certains mots ou expressions est influencée par nos interlocuteurs quotidiens et par le contenu que nous consommons.
Alors qu’une part croissante des médias que nous consommons provient de l’IA générative, cela pourrait-il influencer l’évolution de notre lexique plus rapidement que jamais auparavant ?
C'est possible. C'est même probable.
Mais changer de langue n'est pas forcément une mauvaise chose. C'est le propre des langues.
Mais changer de langue n'est pas forcément une mauvaise chose. C'est le propre des langues.
Cependant, il existe une conséquence linguistique potentielle de l'IA qui n'a pas encore été abordée. Pour cela, nous allons devoir élargir notre champ d'action.

L'impact potentiel de l'IA sur les langues plus petites
Jusqu'à présent, nous nous sommes concentrés sur l'IA et la langue anglaise. En effet, le contenu en anglais domine sur Internet, et c'est à partir de ces données brutes que l'IA les extrait. ChatGPT est donc plus efficace en anglais.
Mais moins de 5 % de la population mondiale a l'anglais comme première langue. Alors que le monde dépend de plus en plus de l'IA – et que cette dernière privilégie l'anglais –, quelles sont les conséquences pour les langues moins répandues ?
La linguiste islandaise Dr Linda Heimisdóttir souligne qu'avec l'essor de l'IA, il existe un risque réel de mort numérique pour les langues plus petites comme la sienne, qui ne compte que quelques centaines de milliers de locuteurs.
L'une des raisons réside dans la facilité d'utilisation. Siri d'Apple ne comprend pas l'islandais ; il est donc plus facile de prononcer une commande en anglais. Si vous essayez d'effectuer une recherche Google en islandais, vous obtiendrez peu de résultats. La saisie semi-automatique et les correcteurs orthographiques sont loin d'être aussi intuitifs avec la langue maternelle d'Heimisdóttir qu'avec l'anglais.
Si vous étiez un adolescent islandais et que vous souhaitiez exploiter pleinement l'IA, vous tourneriez-vous davantage vers l'anglais que vers votre langue maternelle ? C'est ainsi que commence l'extinction d'une langue.
Si vous étiez un adolescent islandais et que vous souhaitiez exploiter pleinement l'IA, vous tourneriez-vous davantage vers l'anglais que vers votre langue maternelle ? C'est ainsi que commence l'extinction d'une langue.
Cependant, il n'est pas encore nécessaire de commencer à planifier des funérailles phonétiques. Heimisdóttir est optimiste : si les développeurs d'IA comprennent que cela pourrait être une conséquence de leur technologie, ils pourront collaborer activement avec des ambassadeurs de langues minoritaires pour intégrer leurs langues dès le début. Heimisdóttir a démontré que c'est possible grâce à son partenariat avec OpenAI.
Si elles y parviennent, Heimisdóttir estime que « l’avenir de la diversité linguistique est prometteur ».

Équilibrer l'IA et un vocabulaire construit par l'homme
Si vous tenez absolument à empêcher ces mots privilégiés par l'IA d'entrer dans votre vocabulaire, pas d'inquiétude. Vous pouvez vous renseigner sur les expressions courantes de ChatGPT pour éviter que ces termes ne s'infiltrent dans votre jargon.
Vous pouvez également utiliser ces connaissances pour repérer plus facilement le contenu écrit par l’IA qui apparaît sur votre écran.
Pourtant, l'auteur pense qu'une prudence prudente suffit à me rassurer. Car, en réalité, les langues évoluent constamment, et une légère influence nigériane-anglaise ne me paraît pas si mal.
Lisez la déclaration du fondateur de Freewrite, Adam Leeb, sur l'IA ici.