overlaylink

L’IA va-t-elle changer notre façon de parler ?

Emily Pogue
août 02, 2024 | 7 lire la lecture

À quelle fréquence utilisez-vous le mot « tapisserie » dans votre langage courant ? Et « delve » ? Le mot « testament » apparaît-il régulièrement dans vos textes ?

Beaucoup d'entre nous diraient probablement non, et pour cause. Ces mots n'ont pas réussi à figurer dans la liste des « 500 mots anglais les plus populaires ». En réalité, ils n'ont probablement pas non plus atteint le top 1 000.

Pourtant, ces termes ont récemment connu une forte augmentation dans les contenus écrits. Par exemple, le Dr Jeremy Nguyen a mené une étude en mars 2024, où il a constaté que 0,5 % des articles publiés sur le site de recherche PubMed contenaient le mot « delve ». Comparez ce chiffre à celui de 2022, lorsque ce chiffre était inférieur à 0,1 %.

Graphique de Jeremy Nguyen, PhD

Alors, qu'est-ce qui a changé au cours de ces 15 mois ? Pourquoi cette soudaine augmentation du nombre d'universitaires utilisant ce terme ?

ChatGPT est sorti en novembre 2022. Nous découvrons maintenant que ChatGPT privilégie certains mots, notamment (vous l'aurez deviné) « delve », « tapestry » et « testament ».

Cela a été un signal d’alarme pour les passionnés de langues du monde entier.

Comment se fait-il que ChatGPT ait choisi ces mots apparemment aléatoires comme favoris ? Et surtout, avec son ascension rapide, l'intelligence artificielle (IA) aura-t-elle le pouvoir de façonner notre langage vernaculaire dans un avenir proche ?

Il semble que la réponse soit (ironiquement) très humaine.

L'IA dans notre vie quotidienne

Bien que l’IA semble à beaucoup comme une nouvelle technologie apparue du jour au lendemain, elle existe de manière subtile depuis des années.

La reconnaissance faciale qui ouvre votre téléphone ? C'est une forme d'IA .

Netflix vous recommande de regarder Peaky Blinders après avoir terminé Breaking Bad ? Un autre type d'IA.

Ce chatbot qui vous demande vos symptômes avant d'envoyer un message à votre médecin ? Un exemple d'IA.

Cependant, il ne s'agissait pas d'exemples de l'IA stéréotypée que beaucoup d'entre nous imaginent aujourd'hui. Il s'agissait de petits systèmes qui nous aidaient à peaufiner une technologie déjà fonctionnelle (notre téléphone, notre application de streaming, notre portail de santé).

Ce n'est que récemment que nous avons été confrontés à un nouveau type d'intelligence artificielle capable de penser par elle-même, sous la forme d'une IA générative, comme ChatGPT d'OpenAI.

Mais ces technologies ne pensent pas réellement par elles-mêmes. Au lieu de cela, elles analysent une quantité extraordinaire d'informations – l'équivalent de millions de livres – et utilisent ces données pour produire des réponses à nos questions.

Pourtant, l'IA ne comprend pas vraiment ce qu'elle nous dit. Kem-Laurin Lubin, Ph. D., a créé une métaphore utile pour expliquer ce concept :

Imaginez que vous soyez enlevé par des extraterrestres et emmené sur une planète ressemblant à la Terre. On vous confie le rôle d'un chef pour un événement crucial, utilisant des ingrédients inconnus provenant d'un jardin extraterrestre, ainsi que ce qui semble être des épices de leur cuisine. Imaginez que vous n'ayez jamais cuisiné et que la moindre erreur puisse avoir de graves conséquences. Imaginez l'IA comme un chef utilisant des données comme ingrédients.

Chez OpenAI, on n'a pas été assez naïf pour envoyer un chef novice à l'aveuglette. Au lieu de cela, ils ont recours à des humains pour coacher leurs futurs cuisiniers et leur indiquer les plats – autrement dit, les lignes de texte – qui leur semblent les plus appétissants.

Les personnes derrière le lexique de l'IA

Le processus d'évaluation des réponses élaborées par l'IA s'appelle l'apprentissage par renforcement à partir du feedback humain (RLHF). Voici notre premier indice expliquant pourquoi ChatGPT s'appuie autant sur certains termes.

Il est coûteux d'employer une armée de testeurs pour évaluer les réponses potentiellement infinies de l'IA. C'est pourquoi (et c'est souvent le cas) les entreprises externalisent ces tâches vers des pays à faible revenu. Dans ces pays, l'anglais est souvent une seconde langue.

Il est courant que les locuteurs non natifs aient un langage plus formel, car l'argot n'est généralement pas enseigné dans les cours de langues. (C'est pourquoi votre espagnol du lycée sonne un peu bizarre en Espagne.)

Certains domaines sont également associés à des termes spécifiques. C'est pourquoi une même pièce est appelée « toilettes » au Canada, « salle de bain » aux États-Unis et « toilettes » en Grande-Bretagne.

Tous ces facteurs s’entremêlent car les anglophones non natifs parlent la langue plus fréquemment, ce qui conduit chaque nation à développer sa propre version de la liste des « 500 mots anglais les plus populaires ».

Tous ces facteurs s’entremêlent car les anglophones non natifs parlent la langue plus fréquemment, ce qui conduit chaque nation à développer sa propre version de la liste des « 500 mots anglais les plus populaires ».

Lorsqu'on analyse les préférences en anglais des pays généralement ciblés pour la main-d'œuvre bon marché, on tombe sur le Nigéria. En anglais nigérian, « delve » est un mot assez courant dans le langage professionnel.

Par conséquent, lorsque les testeurs nigérians indiquent à ChatGPT quelles réponses leur semblent authentiques, ils privilégient les réponses contenant des mots qu'ils utilisent habituellement, comme « delve ».

Et voilà : le mystère de la montée en puissance de ces mots a une réponse logique. Et cela soulève la question suivante :

À mesure que nous utilisons davantage l’IA et consommons plus fréquemment du contenu écrit par l’IA, ces mots privilégiés par l’IA deviendront-ils progressivement plus répandus dans les lexiques des anglophones natifs ?

En fin de compte, cela remet en question l’évolution du langage lui-même.

La progression naturelle du langage : IA ou pas

D'une certaine manière, l'IA a déjà influencé notre langage. Ces dernières années, nous avons ajouté des termes comme « grand modèle de langage » (LLM), « intelligence artificielle générative » (GenAI) et « GPT » (dont le nom complet est « Generative Pre-training Transformer ») à nos dictionnaires.

Mais ce phénomène n'est pas propre à l'IA. Chaque boom technologique a apporté son lot de nouveaux mots, et en a entraîné la disparition. On ne dit plus qu'il faut « enregistrer » quelque chose (en référence à l'enregistrement d'une émission) car :

A) Peu de gens enregistrent des émissions à l’ère des services de streaming

B) plus personne n'utilise de cassettes VHS

Parallèlement, d'autres expressions ont tendance à perdurer. Nous n'avons plus besoin de raccrocher physiquement notre téléphone pour mettre fin à un appel, mais la plupart d'entre nous continuent de dire que nous allons « raccrocher ».

Notre vocabulaire est également influencé par l'actualité. L'expression « distanciation sociale » est devenue courante pendant la pandémie de COVID-19, même si personne ne l'utilisait avant 2020.

La culture pop et les réseaux sociaux jouent également un rôle important dans notre vocabulaire. « Rizz » est entré dans notre vocabulaire en 2023, après que le YouTubeur et utilisateur de Twitch Kai Cenat l'a inventé. Si vous n'êtes pas à la mode auprès des jeunes, « rizz » fait référence au charisme ou à l'assurance d'une personne. (Oui, je me suis sentie vieille en écrivant ça.)

Le fait est que nous adoptons constamment de nouvelles expressions et actualisons notre jargon. La fréquence à laquelle nous utilisons certains mots ou expressions est influencée par nos interlocuteurs quotidiens et par le contenu que nous consommons.

Alors qu’une part croissante des médias que nous consommons provient de l’IA générative, cela pourrait-il influencer l’évolution de notre lexique plus rapidement que jamais auparavant ?

C'est possible. C'est même probable.

Mais changer de langue n'est pas forcément une mauvaise chose. C'est le propre des langues.

Mais changer de langue n'est pas forcément une mauvaise chose. C'est le propre des langues.

Cependant, il existe une conséquence linguistique potentielle de l'IA qui n'a pas encore été abordée. Pour cela, nous allons devoir élargir notre champ d'action.

L'impact potentiel de l'IA sur les langues plus petites

Jusqu'à présent, nous nous sommes concentrés sur l'IA et la langue anglaise. En effet, le contenu en anglais domine sur Internet, et c'est à partir de ces données brutes que l'IA les extrait. ChatGPT est donc plus efficace en anglais.

Mais moins de 5 % de la population mondiale a l'anglais comme première langue. Alors que le monde dépend de plus en plus de l'IA – et que cette dernière privilégie l'anglais –, quelles sont les conséquences pour les langues moins répandues ?

La linguiste islandaise Dr Linda Heimisdóttir souligne qu'avec l'essor de l'IA, il existe un risque réel de mort numérique pour les langues plus petites comme la sienne, qui ne compte que quelques centaines de milliers de locuteurs.

L'une des raisons réside dans la facilité d'utilisation. Siri d'Apple ne comprend pas l'islandais ; il est donc plus facile de prononcer une commande en anglais. Si vous essayez d'effectuer une recherche Google en islandais, vous obtiendrez peu de résultats. La saisie semi-automatique et les correcteurs orthographiques sont loin d'être aussi intuitifs avec la langue maternelle d'Heimisdóttir qu'avec l'anglais.

Si vous étiez un adolescent islandais et que vous souhaitiez exploiter pleinement l'IA, vous tourneriez-vous davantage vers l'anglais que vers votre langue maternelle ? C'est ainsi que commence l'extinction d'une langue.

Si vous étiez un adolescent islandais et que vous souhaitiez exploiter pleinement l'IA, vous tourneriez-vous davantage vers l'anglais que vers votre langue maternelle ? C'est ainsi que commence l'extinction d'une langue.

Cependant, il n'est pas encore nécessaire de commencer à planifier des funérailles phonétiques. Heimisdóttir est optimiste : si les développeurs d'IA comprennent que cela pourrait être une conséquence de leur technologie, ils pourront collaborer activement avec des ambassadeurs de langues minoritaires pour intégrer leurs langues dès le début. Heimisdóttir a démontré que c'est possible grâce à son partenariat avec OpenAI.

Si elles y parviennent, Heimisdóttir estime que « l’avenir de la diversité linguistique est prometteur ».

Équilibrer l'IA et un vocabulaire construit par l'homme

Si vous tenez absolument à empêcher ces mots privilégiés par l'IA d'entrer dans votre vocabulaire, pas d'inquiétude. Vous pouvez vous renseigner sur les expressions courantes de ChatGPT pour éviter que ces termes ne s'infiltrent dans votre jargon.

Vous pouvez également utiliser ces connaissances pour repérer plus facilement le contenu écrit par l’IA qui apparaît sur votre écran.

Pourtant, l'auteur pense qu'une prudence prudente suffit à me rassurer. Car, en réalité, les langues évoluent constamment, et une légère influence nigériane-anglaise ne me paraît pas si mal.

Lisez la déclaration du fondateur de Freewrite, Adam Leeb, sur l'IA ici.

août 22, 2025 3 lire la lecture

Most of us are surrounded by screens all day. To get your writing done, take writer Shannon Liao's advice and unplug.

juillet 21, 2025 2 lire la lecture

It’s literary legend Ernest Hemingway’s birthday week, and we’re throwing "A Moveable Feast" in his honor. Purchase a Hemingwrite this week and be entered to have your purchase completely refunded.

juillet 21, 2025 2 lire la lecture

Official Rules for the Promotion

No purchase necessary to enter or win. A purchase will not increase your changes of wining. Void where prohibited or restricted by law.

1. Eligibility

The Purchase Refund Giveaway ("Promotion") is open only to legal residents of the 50 United States and the District of Columbia, who are 18 years of age or older at the time of entry. Employees, officers, and directors of Astrohaus ("Sponsor") and its affiliates, subsidiaries, advertising and promotion agencies, and their immediate family members (spouse, parents, siblings, and children) and/or those living in the same household are not eligible. The Promotion is subject to all applicable federal, state, and local laws and regulations.

2. Promotion Period

The Promotion begins at 8 a.m. EST Monday, July 21, and ends at 11:59 p.m. EST on Sunday, July 27 ("Promotion Period"). Sponsor's computer is the official timekeeping device for this Promotion.

3. How to Enter

There are two (2) ways to enter:

a) Purchase Method:

During the Promotion Period, make a purchase of any product through https://getfreewrite.com/. All eligible purchasers will automatically be entered into the Promotion. Limit one (1) entry per purchase.

b) Free Alternate Method of Entry (AMOE):

To enter without making a purchase, fill out the form here.Limit one (1) AMOE entry per person.

4. Prize

One (1) Grand Prize: A refund equal to the amount of the winner’s eligible purchase (not to exceed $1,099.00 USD). If the winner entered via the AMOE method, they will receive one Ernest Hemingway Signature Edition Smart Typewriter.

Approximate Retail Value (“ARV”): up to $1,099.00 USD.

5. Winner Selection

One (1) potential winner will be selected in a random drawing on or about August 15, from among all eligible entries received during the Promotion Period. Odds of winning depend on the total number of eligible entries received.

6. Winner Notification

The potential winner will be notified by email within five (5) business days following the drawing. The potential winner may be required to complete and return an Affidavit of Eligibility, Liability & Publicity Release within seven (7) days of notification. If a selected winner cannot be contacted, is ineligible, fails to claim the prize, or fails to timely return the required documents, the prize may be forfeited and an alternate winner selected.

7. General Conditions

By participating, entrants agree to abide by these Official Rules and the decisions of the Sponsor, which are final. The Sponsor reserves the right to cancel, modify, or suspend the Promotion if it becomes technically corrupted or cannot be conducted as planned. The prize is non-transferable. All federal, state, and local taxes are the responsibility of the winner.

8. Limitation of Liability

Sponsor is not responsible for lost, late, misdirected, damaged, or illegible entries or for any technical or human error that may occur in the administration of the Promotion.

9. Privacy

Any personal information collected will be used in accordance with the Sponsor’s Privacy Policy located at https://getfreewrite.com/pages/privacy-policy.

9. Sponsor

Astrohaus
1632 1st Avenue #29179
New York, NY 10028