overlaylink

L’IA va-t-elle changer notre façon de parler ?

Emily Pogue
août 02, 2024 | 7 lire la lecture

À quelle fréquence utilisez-vous le mot « tapisserie » dans votre langage courant ? Et « delve » ? Le mot « testament » apparaît-il régulièrement dans vos textes ?

Beaucoup d'entre nous diraient probablement non, et pour cause. Ces mots n'ont pas réussi à figurer dans la liste des « 500 mots anglais les plus populaires ». En réalité, ils n'ont probablement pas non plus atteint le top 1 000.

Pourtant, ces termes ont récemment connu une forte augmentation dans les contenus écrits. Par exemple, le Dr Jeremy Nguyen a mené une étude en mars 2024, où il a constaté que 0,5 % des articles publiés sur le site de recherche PubMed contenaient le mot « delve ». Comparez ce chiffre à celui de 2022, lorsque ce chiffre était inférieur à 0,1 %.

Graphique de Jeremy Nguyen, PhD

Alors, qu'est-ce qui a changé au cours de ces 15 mois ? Pourquoi cette soudaine augmentation du nombre d'universitaires utilisant ce terme ?

ChatGPT est sorti en novembre 2022. Nous découvrons maintenant que ChatGPT privilégie certains mots, notamment (vous l'aurez deviné) « delve », « tapestry » et « testament ».

Cela a été un signal d’alarme pour les passionnés de langues du monde entier.

Comment se fait-il que ChatGPT ait choisi ces mots apparemment aléatoires comme favoris ? Et surtout, avec son ascension rapide, l'intelligence artificielle (IA) aura-t-elle le pouvoir de façonner notre langage vernaculaire dans un avenir proche ?

Il semble que la réponse soit (ironiquement) très humaine.

L'IA dans notre vie quotidienne

Bien que l’IA semble à beaucoup comme une nouvelle technologie apparue du jour au lendemain, elle existe de manière subtile depuis des années.

La reconnaissance faciale qui ouvre votre téléphone ? C'est une forme d'IA .

Netflix vous recommande de regarder Peaky Blinders après avoir terminé Breaking Bad ? Un autre type d'IA.

Ce chatbot qui vous demande vos symptômes avant d'envoyer un message à votre médecin ? Un exemple d'IA.

Cependant, il ne s'agissait pas d'exemples de l'IA stéréotypée que beaucoup d'entre nous imaginent aujourd'hui. Il s'agissait de petits systèmes qui nous aidaient à peaufiner une technologie déjà fonctionnelle (notre téléphone, notre application de streaming, notre portail de santé).

Ce n'est que récemment que nous avons été confrontés à un nouveau type d'intelligence artificielle capable de penser par elle-même, sous la forme d'une IA générative, comme ChatGPT d'OpenAI.

Mais ces technologies ne pensent pas réellement par elles-mêmes. Au lieu de cela, elles analysent une quantité extraordinaire d'informations – l'équivalent de millions de livres – et utilisent ces données pour produire des réponses à nos questions.

Pourtant, l'IA ne comprend pas vraiment ce qu'elle nous dit. Kem-Laurin Lubin, Ph. D., a créé une métaphore utile pour expliquer ce concept :

Imaginez que vous soyez enlevé par des extraterrestres et emmené sur une planète ressemblant à la Terre. On vous confie le rôle d'un chef pour un événement crucial, utilisant des ingrédients inconnus provenant d'un jardin extraterrestre, ainsi que ce qui semble être des épices de leur cuisine. Imaginez que vous n'ayez jamais cuisiné et que la moindre erreur puisse avoir de graves conséquences. Imaginez l'IA comme un chef utilisant des données comme ingrédients.

Chez OpenAI, on n'a pas été assez naïf pour envoyer un chef novice à l'aveuglette. Au lieu de cela, ils ont recours à des humains pour coacher leurs futurs cuisiniers et leur indiquer les plats – autrement dit, les lignes de texte – qui leur semblent les plus appétissants.

Les personnes derrière le lexique de l'IA

Le processus d'évaluation des réponses élaborées par l'IA s'appelle l'apprentissage par renforcement à partir du feedback humain (RLHF). Voici notre premier indice expliquant pourquoi ChatGPT s'appuie autant sur certains termes.

Il est coûteux d'employer une armée de testeurs pour évaluer les réponses potentiellement infinies de l'IA. C'est pourquoi (et c'est souvent le cas) les entreprises externalisent ces tâches vers des pays à faible revenu. Dans ces pays, l'anglais est souvent une seconde langue.

Il est courant que les locuteurs non natifs aient un langage plus formel, car l'argot n'est généralement pas enseigné dans les cours de langues. (C'est pourquoi votre espagnol du lycée sonne un peu bizarre en Espagne.)

Certains domaines sont également associés à des termes spécifiques. C'est pourquoi une même pièce est appelée « toilettes » au Canada, « salle de bain » aux États-Unis et « toilettes » en Grande-Bretagne.

Tous ces facteurs s’entremêlent car les anglophones non natifs parlent la langue plus fréquemment, ce qui conduit chaque nation à développer sa propre version de la liste des « 500 mots anglais les plus populaires ».

Tous ces facteurs s’entremêlent car les anglophones non natifs parlent la langue plus fréquemment, ce qui conduit chaque nation à développer sa propre version de la liste des « 500 mots anglais les plus populaires ».

Lorsqu'on analyse les préférences en anglais des pays généralement ciblés pour la main-d'œuvre bon marché, on tombe sur le Nigéria. En anglais nigérian, « delve » est un mot assez courant dans le langage professionnel.

Par conséquent, lorsque les testeurs nigérians indiquent à ChatGPT quelles réponses leur semblent authentiques, ils privilégient les réponses contenant des mots qu'ils utilisent habituellement, comme « delve ».

Et voilà : le mystère de la montée en puissance de ces mots a une réponse logique. Et cela soulève la question suivante :

À mesure que nous utilisons davantage l’IA et consommons plus fréquemment du contenu écrit par l’IA, ces mots privilégiés par l’IA deviendront-ils progressivement plus répandus dans les lexiques des anglophones natifs ?

En fin de compte, cela remet en question l’évolution du langage lui-même.

La progression naturelle du langage : IA ou pas

D'une certaine manière, l'IA a déjà influencé notre langage. Ces dernières années, nous avons ajouté des termes comme « grand modèle de langage » (LLM), « intelligence artificielle générative » (GenAI) et « GPT » (dont le nom complet est « Generative Pre-training Transformer ») à nos dictionnaires.

Mais ce phénomène n'est pas propre à l'IA. Chaque boom technologique a apporté son lot de nouveaux mots, et en a entraîné la disparition. On ne dit plus qu'il faut « enregistrer » quelque chose (en référence à l'enregistrement d'une émission) car :

A) Peu de gens enregistrent des émissions à l’ère des services de streaming

B) plus personne n'utilise de cassettes VHS

Parallèlement, d'autres expressions ont tendance à perdurer. Nous n'avons plus besoin de raccrocher physiquement notre téléphone pour mettre fin à un appel, mais la plupart d'entre nous continuent de dire que nous allons « raccrocher ».

Notre vocabulaire est également influencé par l'actualité. L'expression « distanciation sociale » est devenue courante pendant la pandémie de COVID-19, même si personne ne l'utilisait avant 2020.

La culture pop et les réseaux sociaux jouent également un rôle important dans notre vocabulaire. « Rizz » est entré dans notre vocabulaire en 2023, après que le YouTubeur et utilisateur de Twitch Kai Cenat l'a inventé. Si vous n'êtes pas à la mode auprès des jeunes, « rizz » fait référence au charisme ou à l'assurance d'une personne. (Oui, je me suis sentie vieille en écrivant ça.)

Le fait est que nous adoptons constamment de nouvelles expressions et actualisons notre jargon. La fréquence à laquelle nous utilisons certains mots ou expressions est influencée par nos interlocuteurs quotidiens et par le contenu que nous consommons.

Alors qu’une part croissante des médias que nous consommons provient de l’IA générative, cela pourrait-il influencer l’évolution de notre lexique plus rapidement que jamais auparavant ?

C'est possible. C'est même probable.

Mais changer de langue n'est pas forcément une mauvaise chose. C'est le propre des langues.

Mais changer de langue n'est pas forcément une mauvaise chose. C'est le propre des langues.

Cependant, il existe une conséquence linguistique potentielle de l'IA qui n'a pas encore été abordée. Pour cela, nous allons devoir élargir notre champ d'action.

L'impact potentiel de l'IA sur les langues plus petites

Jusqu'à présent, nous nous sommes concentrés sur l'IA et la langue anglaise. En effet, le contenu en anglais domine sur Internet, et c'est à partir de ces données brutes que l'IA les extrait. ChatGPT est donc plus efficace en anglais.

Mais moins de 5 % de la population mondiale a l'anglais comme première langue. Alors que le monde dépend de plus en plus de l'IA – et que cette dernière privilégie l'anglais –, quelles sont les conséquences pour les langues moins répandues ?

La linguiste islandaise Dr Linda Heimisdóttir souligne qu'avec l'essor de l'IA, il existe un risque réel de mort numérique pour les langues plus petites comme la sienne, qui ne compte que quelques centaines de milliers de locuteurs.

L'une des raisons réside dans la facilité d'utilisation. Siri d'Apple ne comprend pas l'islandais ; il est donc plus facile de prononcer une commande en anglais. Si vous essayez d'effectuer une recherche Google en islandais, vous obtiendrez peu de résultats. La saisie semi-automatique et les correcteurs orthographiques sont loin d'être aussi intuitifs avec la langue maternelle d'Heimisdóttir qu'avec l'anglais.

Si vous étiez un adolescent islandais et que vous souhaitiez exploiter pleinement l'IA, vous tourneriez-vous davantage vers l'anglais que vers votre langue maternelle ? C'est ainsi que commence l'extinction d'une langue.

Si vous étiez un adolescent islandais et que vous souhaitiez exploiter pleinement l'IA, vous tourneriez-vous davantage vers l'anglais que vers votre langue maternelle ? C'est ainsi que commence l'extinction d'une langue.

Cependant, il n'est pas encore nécessaire de commencer à planifier des funérailles phonétiques. Heimisdóttir est optimiste : si les développeurs d'IA comprennent que cela pourrait être une conséquence de leur technologie, ils pourront collaborer activement avec des ambassadeurs de langues minoritaires pour intégrer leurs langues dès le début. Heimisdóttir a démontré que c'est possible grâce à son partenariat avec OpenAI.

Si elles y parviennent, Heimisdóttir estime que « l’avenir de la diversité linguistique est prometteur ».

Équilibrer l'IA et un vocabulaire construit par l'homme

Si vous tenez absolument à empêcher ces mots privilégiés par l'IA d'entrer dans votre vocabulaire, pas d'inquiétude. Vous pouvez vous renseigner sur les expressions courantes de ChatGPT pour éviter que ces termes ne s'infiltrent dans votre jargon.

Vous pouvez également utiliser ces connaissances pour repérer plus facilement le contenu écrit par l’IA qui apparaît sur votre écran.

Pourtant, l'auteur pense qu'une prudence prudente suffit à me rassurer. Car, en réalité, les langues évoluent constamment, et une légère influence nigériane-anglaise ne me paraît pas si mal.

Lisez la déclaration du fondateur de Freewrite, Adam Leeb, sur l'IA ici.

septembre 10, 2025 3 lire la lecture

The Freewrite 500 Writing Contest — Terms and Conditions

Last Updated: 10-09-2025

By submitting an entry to The Freewrite 500 Writing Contest (the “Contest”), you agree to abide by the following Terms and Conditions.

1. Organizer

The Contest is organized by Freewrite, a brand owned and operated by Astrohaus, Inc. (hereinafter referred to as “Freewrite”, “we”, “our”, or “us”).

2. Eligibility

  • The Contest is open to individuals who are 18 years of age or older at the time of entry.

  • Employees of Freewrite, the Flash Fiction Institute, and their immediate families are not eligible to enter.

  • Void where prohibited by law.

3. How to Enter

  • Entries must be submitted through the official entry form before Monday, September 22.

  • Entries must be original works of flash fiction no longer than 500 words.

  • All submissions must be the original work of the entrant.

  • Only one entry per person is allowed.

  • Entries must be written in English.

  • The deadline for submission is 11:59 p.m. EST on September 22, 2025. Late or incomplete entries will not be accepted.

4. Entry Requirements

  • Submissions must be the entrant’s own original work and must not have been previously published, including on personal blogs or social media.

  • Entries must not contain any material that is obscene, offensive, defamatory, or otherwise inappropriate.

  • By entering, you confirm that your submission does not infringe on any third-party rights, including copyright, trademark, or privacy rights.

5. Judging and Winner Selection

  • All eligible entries will be judged by a panel of reviewers affiliated with Freewrite and the Flash Fiction Institute.

  • Judging criteria include length, creativity, and adherence to theme, and overall quality of writing.

  • The winner will be notified via email.

6. Use of Generative AI Prohibited

  • The use of generative AI in the creation of a submission for this competition is prohibited.

  • The organizers reserve the right to disqualify any entry that is suspected to have been generated, in whole or in part, using generative AI tools (including but not limited to text-generating algorithms, large language models, or similar technologies).

7. Prize

  • The winning entry will be published on both the Freewrite Blog and the Flash Fiction Institute Blog.

  • The winner will receive recognition across Freewrite and Flash Fiction Institute's social media platforms.

  • No cash prizes will be offered. Prizes include a Freewrite Traveler, a Words Are Hard writing prompt deck, publication on the Freewrite blog and the Flash Fiction Institute blog, and a free flash gym session hosted by the Flash Fiction Institute.

8. Rights and Usage

  • By entering the contest, entrants grant Freewrite and the Flash Fiction Institute first publication rights. This means Freewrite and the Flash Fiction Institute have a non-exclusive, royalty-free, worldwide license to publish, reproduce, and distribute the submitted entry in connection with the promotion of the Contest, including on their websites, blogs, email newsletters, social media channels, and more.

  • After initial publication, all rights revert back to the author, who is then free to republish or distribute their work elsewhere. However, we request that any subsequent publication acknowledges Freewrite and the Flash Fiction Institute as the original place of publication.

  • The winning author will be credited by name or preferred pen name when their work is published.

9. Privacy

  • Personal information collected during the entry process will be used only for the administration of the Contest and in accordance with Freewrite’s Privacy Policy.

  • Entrants may be contacted by Freewrite regarding their submission or related opportunities.

10. Disqualification

Freewrite reserves the right to disqualify any entry that:

  • Violates these Terms and Conditions,

  • Is found to contain plagiarized material,

  • Is deemed offensive or inappropriate,

  • Is submitted by someone ineligible.

11. Limitation of Liability

Freewrite is not responsible for:

  • Lost, late, incomplete, or misdirected entries;

  • Technical failures of any kind;

  • Any injury or damage to persons or property related to participation in the Contest.

12. Governing Law

These Terms and Conditions shall be governed by and construed in accordance with the laws of the State of [Insert State], without regard to its conflict of laws principles.

13. Contact

For any questions regarding the Contest, please contact us at:
📧 hello@getfreewrite.com.

septembre 10, 2025 1 lire la lecture

One blank page. 500 words. Zero fear. Let’s see what happens when you stop thinking and just go. It's the Freewrite 500, presented in collaboration with the Flash Fiction Institute.

août 22, 2025 3 lire la lecture

Most of us are surrounded by screens all day. To get your writing done, take writer Shannon Liao's advice and unplug.