overlaylink

L’IA va-t-elle changer notre façon de parler ?

Emily Pogue
août 02, 2024 | 7 lire la lecture

À quelle fréquence utilisez-vous le mot « tapisserie » dans votre langage courant ? Et « delve » ? Le mot « testament » apparaît-il régulièrement dans vos textes ?

Beaucoup d'entre nous diraient probablement non, et pour cause. Ces mots n'ont pas réussi à figurer dans la liste des « 500 mots anglais les plus populaires ». En réalité, ils n'ont probablement pas non plus atteint le top 1 000.

Pourtant, ces termes ont récemment connu une forte augmentation dans les contenus écrits. Par exemple, le Dr Jeremy Nguyen a mené une étude en mars 2024, où il a constaté que 0,5 % des articles publiés sur le site de recherche PubMed contenaient le mot « delve ». Comparez ce chiffre à celui de 2022, lorsque ce chiffre était inférieur à 0,1 %.

Graphique de Jeremy Nguyen, PhD

Alors, qu'est-ce qui a changé au cours de ces 15 mois ? Pourquoi cette soudaine augmentation du nombre d'universitaires utilisant ce terme ?

ChatGPT est sorti en novembre 2022. Nous découvrons maintenant que ChatGPT privilégie certains mots, notamment (vous l'aurez deviné) « delve », « tapestry » et « testament ».

Cela a été un signal d’alarme pour les passionnés de langues du monde entier.

Comment se fait-il que ChatGPT ait choisi ces mots apparemment aléatoires comme favoris ? Et surtout, avec son ascension rapide, l'intelligence artificielle (IA) aura-t-elle le pouvoir de façonner notre langage vernaculaire dans un avenir proche ?

Il semble que la réponse soit (ironiquement) très humaine.

L'IA dans notre vie quotidienne

Bien que l’IA semble à beaucoup comme une nouvelle technologie apparue du jour au lendemain, elle existe de manière subtile depuis des années.

La reconnaissance faciale qui ouvre votre téléphone ? C'est une forme d'IA .

Netflix vous recommande de regarder Peaky Blinders après avoir terminé Breaking Bad ? Un autre type d'IA.

Ce chatbot qui vous demande vos symptômes avant d'envoyer un message à votre médecin ? Un exemple d'IA.

Cependant, il ne s'agissait pas d'exemples de l'IA stéréotypée que beaucoup d'entre nous imaginent aujourd'hui. Il s'agissait de petits systèmes qui nous aidaient à peaufiner une technologie déjà fonctionnelle (notre téléphone, notre application de streaming, notre portail de santé).

Ce n'est que récemment que nous avons été confrontés à un nouveau type d'intelligence artificielle capable de penser par elle-même, sous la forme d'une IA générative, comme ChatGPT d'OpenAI.

Mais ces technologies ne pensent pas réellement par elles-mêmes. Au lieu de cela, elles analysent une quantité extraordinaire d'informations – l'équivalent de millions de livres – et utilisent ces données pour produire des réponses à nos questions.

Pourtant, l'IA ne comprend pas vraiment ce qu'elle nous dit. Kem-Laurin Lubin, Ph. D., a créé une métaphore utile pour expliquer ce concept :

Imaginez que vous soyez enlevé par des extraterrestres et emmené sur une planète ressemblant à la Terre. On vous confie le rôle d'un chef pour un événement crucial, utilisant des ingrédients inconnus provenant d'un jardin extraterrestre, ainsi que ce qui semble être des épices de leur cuisine. Imaginez que vous n'ayez jamais cuisiné et que la moindre erreur puisse avoir de graves conséquences. Imaginez l'IA comme un chef utilisant des données comme ingrédients.

Chez OpenAI, on n'a pas été assez naïf pour envoyer un chef novice à l'aveuglette. Au lieu de cela, ils ont recours à des humains pour coacher leurs futurs cuisiniers et leur indiquer les plats – autrement dit, les lignes de texte – qui leur semblent les plus appétissants.

Les personnes derrière le lexique de l'IA

Le processus d'évaluation des réponses élaborées par l'IA s'appelle l'apprentissage par renforcement à partir du feedback humain (RLHF). Voici notre premier indice expliquant pourquoi ChatGPT s'appuie autant sur certains termes.

Il est coûteux d'employer une armée de testeurs pour évaluer les réponses potentiellement infinies de l'IA. C'est pourquoi (et c'est souvent le cas) les entreprises externalisent ces tâches vers des pays à faible revenu. Dans ces pays, l'anglais est souvent une seconde langue.

Il est courant que les locuteurs non natifs aient un langage plus formel, car l'argot n'est généralement pas enseigné dans les cours de langues. (C'est pourquoi votre espagnol du lycée sonne un peu bizarre en Espagne.)

Certains domaines sont également associés à des termes spécifiques. C'est pourquoi une même pièce est appelée « toilettes » au Canada, « salle de bain » aux États-Unis et « toilettes » en Grande-Bretagne.

Tous ces facteurs s’entremêlent car les anglophones non natifs parlent la langue plus fréquemment, ce qui conduit chaque nation à développer sa propre version de la liste des « 500 mots anglais les plus populaires ».

Tous ces facteurs s’entremêlent car les anglophones non natifs parlent la langue plus fréquemment, ce qui conduit chaque nation à développer sa propre version de la liste des « 500 mots anglais les plus populaires ».

Lorsqu'on analyse les préférences en anglais des pays généralement ciblés pour la main-d'œuvre bon marché, on tombe sur le Nigéria. En anglais nigérian, « delve » est un mot assez courant dans le langage professionnel.

Par conséquent, lorsque les testeurs nigérians indiquent à ChatGPT quelles réponses leur semblent authentiques, ils privilégient les réponses contenant des mots qu'ils utilisent habituellement, comme « delve ».

Et voilà : le mystère de la montée en puissance de ces mots a une réponse logique. Et cela soulève la question suivante :

À mesure que nous utilisons davantage l’IA et consommons plus fréquemment du contenu écrit par l’IA, ces mots privilégiés par l’IA deviendront-ils progressivement plus répandus dans les lexiques des anglophones natifs ?

En fin de compte, cela remet en question l’évolution du langage lui-même.

La progression naturelle du langage : IA ou pas

D'une certaine manière, l'IA a déjà influencé notre langage. Ces dernières années, nous avons ajouté des termes comme « grand modèle de langage » (LLM), « intelligence artificielle générative » (GenAI) et « GPT » (dont le nom complet est « Generative Pre-training Transformer ») à nos dictionnaires.

Mais ce phénomène n'est pas propre à l'IA. Chaque boom technologique a apporté son lot de nouveaux mots, et en a entraîné la disparition. On ne dit plus qu'il faut « enregistrer » quelque chose (en référence à l'enregistrement d'une émission) car :

A) Peu de gens enregistrent des émissions à l’ère des services de streaming

B) plus personne n'utilise de cassettes VHS

Parallèlement, d'autres expressions ont tendance à perdurer. Nous n'avons plus besoin de raccrocher physiquement notre téléphone pour mettre fin à un appel, mais la plupart d'entre nous continuent de dire que nous allons « raccrocher ».

Notre vocabulaire est également influencé par l'actualité. L'expression « distanciation sociale » est devenue courante pendant la pandémie de COVID-19, même si personne ne l'utilisait avant 2020.

La culture pop et les réseaux sociaux jouent également un rôle important dans notre vocabulaire. « Rizz » est entré dans notre vocabulaire en 2023, après que le YouTubeur et utilisateur de Twitch Kai Cenat l'a inventé. Si vous n'êtes pas à la mode auprès des jeunes, « rizz » fait référence au charisme ou à l'assurance d'une personne. (Oui, je me suis sentie vieille en écrivant ça.)

Le fait est que nous adoptons constamment de nouvelles expressions et actualisons notre jargon. La fréquence à laquelle nous utilisons certains mots ou expressions est influencée par nos interlocuteurs quotidiens et par le contenu que nous consommons.

Alors qu’une part croissante des médias que nous consommons provient de l’IA générative, cela pourrait-il influencer l’évolution de notre lexique plus rapidement que jamais auparavant ?

C'est possible. C'est même probable.

Mais changer de langue n'est pas forcément une mauvaise chose. C'est le propre des langues.

Mais changer de langue n'est pas forcément une mauvaise chose. C'est le propre des langues.

Cependant, il existe une conséquence linguistique potentielle de l'IA qui n'a pas encore été abordée. Pour cela, nous allons devoir élargir notre champ d'action.

L'impact potentiel de l'IA sur les langues plus petites

Jusqu'à présent, nous nous sommes concentrés sur l'IA et la langue anglaise. En effet, le contenu en anglais domine sur Internet, et c'est à partir de ces données brutes que l'IA les extrait. ChatGPT est donc plus efficace en anglais.

Mais moins de 5 % de la population mondiale a l'anglais comme première langue. Alors que le monde dépend de plus en plus de l'IA – et que cette dernière privilégie l'anglais –, quelles sont les conséquences pour les langues moins répandues ?

La linguiste islandaise Dr Linda Heimisdóttir souligne qu'avec l'essor de l'IA, il existe un risque réel de mort numérique pour les langues plus petites comme la sienne, qui ne compte que quelques centaines de milliers de locuteurs.

L'une des raisons réside dans la facilité d'utilisation. Siri d'Apple ne comprend pas l'islandais ; il est donc plus facile de prononcer une commande en anglais. Si vous essayez d'effectuer une recherche Google en islandais, vous obtiendrez peu de résultats. La saisie semi-automatique et les correcteurs orthographiques sont loin d'être aussi intuitifs avec la langue maternelle d'Heimisdóttir qu'avec l'anglais.

Si vous étiez un adolescent islandais et que vous souhaitiez exploiter pleinement l'IA, vous tourneriez-vous davantage vers l'anglais que vers votre langue maternelle ? C'est ainsi que commence l'extinction d'une langue.

Si vous étiez un adolescent islandais et que vous souhaitiez exploiter pleinement l'IA, vous tourneriez-vous davantage vers l'anglais que vers votre langue maternelle ? C'est ainsi que commence l'extinction d'une langue.

Cependant, il n'est pas encore nécessaire de commencer à planifier des funérailles phonétiques. Heimisdóttir est optimiste : si les développeurs d'IA comprennent que cela pourrait être une conséquence de leur technologie, ils pourront collaborer activement avec des ambassadeurs de langues minoritaires pour intégrer leurs langues dès le début. Heimisdóttir a démontré que c'est possible grâce à son partenariat avec OpenAI.

Si elles y parviennent, Heimisdóttir estime que « l’avenir de la diversité linguistique est prometteur ».

Équilibrer l'IA et un vocabulaire construit par l'homme

Si vous tenez absolument à empêcher ces mots privilégiés par l'IA d'entrer dans votre vocabulaire, pas d'inquiétude. Vous pouvez vous renseigner sur les expressions courantes de ChatGPT pour éviter que ces termes ne s'infiltrent dans votre jargon.

Vous pouvez également utiliser ces connaissances pour repérer plus facilement le contenu écrit par l’IA qui apparaît sur votre écran.

Pourtant, l'auteur pense qu'une prudence prudente suffit à me rassurer. Car, en réalité, les langues évoluent constamment, et une légère influence nigériane-anglaise ne me paraît pas si mal.

Lisez la déclaration du fondateur de Freewrite, Adam Leeb, sur l'IA ici.

octobre 26, 2025 2 lire la lecture

NaNoWriMo has fallen. A band of rebels known as NoNotWriMo has risen to take its place.

Every November, writers around the globe attempt to write 50,000 words in one month. But last year the organization behind the beloved National Novel Writing Month disintegrated.

In 2025, it's more important than ever to support feats of human creativity. So an intrepid group of humans has banded together to face the antagonist of our age.

Join us in the fight against the Modern Prometheus.

octobre 21, 2025 2 lire la lecture

Official Rules for the Giveaway

No purchase necessary to enter or win. A purchase will not increase your changes of wining. Void where prohibited or restricted by law.

1. Sponsor

The Haunted Traveler Giveaway (“Giveaway”) is sponsored by Freewrite (a product of Astrohaus Inc.), located at Astrohaus, 1632 1st Avenue #29179, New York, NY 10028 (“Sponsor”).

2. Eligibility

The Giveaway is open to legal residents of the 50 United States and the District of Columbia who are at least 18 years of age at the time of entry. Employees of Sponsor and their immediate family members or persons living in the same household are not eligible to enter. The Giveaway is subject to all applicable federal, state, and local laws and regulations and is void where prohibited.

3. Giveaway Period

The Giveaway begins at 12:01 a.m. EST on Tuesday, October 21, and ends at 11:59 p.m. EST on Thursday, October 30 (“Giveaway Period”). Entries submitted before or after the Giveaway Period will not be eligible. Sponsor's computer is the official timekeeping device for this Promotion.

4. How to Enter

To enter the Giveaway, participants must submit the official giveaway form with their name and email address. Limit one (1) entry per person unless otherwise stated. Entries that are incomplete or do not adhere to the rules or specifications may be disqualified. Find the form here:https://getfreewrite.com/#hauntedtraveler

5. Prize

One (1) winner will receive one (1) Freewrite Traveler with an approximate retail value of $549. Prize is non-transferable and no substitution or cash equivalent is allowed, except at Sponsor’s sole discretion.

6. Winner Selection and Notification

Winner will be selected at random from all eligible entries received during the Giveaway Period. The drawing will take place on or about October 31. The winner will be notified via email within 5 business days of selection. If the winner cannot be contacted, is ineligible, or fails to respond within 3 business days, the prize may be forfeited and an alternate winner selected.

7. Publicity

By entering, participants grant Sponsor the right to use their name, likeness, and entry for promotional and marketing purposes without further compensation, unless prohibited by law.

8. General Conditions

By participating, entrants agree to abide by these Official Rules and the decisions of the Sponsor, which are final. The Sponsor reserves the right to cancel, modify, or suspend the Promotion if it becomes technically corrupted or cannot be conducted as planned. The prize is non-transferable. All federal, state, and local taxes are the responsibility of the winner. Sponsor reserves the right, in its sole discretion, to disqualify any individual who tampers with the entry process or otherwise violates these Terms and Conditions.

9. Limitation of Liability

By participating, entrants agree to release and hold harmless the Sponsor, its affiliates, and their respective officers, directors, employees, and agents from any and all liability arising from or in connection with participation in the Giveaway or acceptance, use, or misuse of the prize.

10. Privacy

Information submitted with an entry is subject to the Sponsor’s Privacy Policy.

octobre 12, 2025 4 lire la lecture

The winner of the inaugural Freewrite 500 flash fiction competition is Brie Ripley Sparks, with her short story "High Holy Days."