Réflexions autour de la démocratisation des outils d’IA writing, et comment la technologie est en train de façonner nos mots … pour le meilleur ou le pire ? Un article qui n’a pas (encore) été coécrit par une IA, mais avec deux humains : Quentin Franque et Benoît Zante.
L’IA writing se démocratise
La news a fait l’effet d’une bombe. Jasper, la start-up de contenus IA fondée en 2021 a annoncé la semaine dernière une levée de fonds record de $125 millions pour une valorisation de $1,5 milliard, ce qui en fait une licorne, une espèce devenue un peu plus rare ces derniers temps. Une levée qui s’inscrit dans un contexte de forte croissance pour le secteur puisque le marché des logiciels de rédaction assistée par l’IA a été évalué à $410,92 millions en 2021 et devrait atteindre $1 363,99 millions d'ici 2030, avec un taux de croissance annuel moyen de 14,27 % de 2023 à 2030.
Mais qu’est ce qu’on entend par “IA Writing” au juste ? Il y a d’abord eu les outils de correction. D’ailleurs, qui n’a pas déjà copié-collé des textes entiers dans Reverso ? Sauf que, jusqu’ici, Reverso, fondé en 1997, corrigeait votre texte en fonction de critères orthographiques et grammaticaux fixes, mais le correcteur ne respectait ni votre style, ni le ton adapté à la situation, ni votre façon habituelle de s’adresser à votre interlocuteur.
22 ans plus tard, en 2019, l’association - devenue depuis une entreprise à “but lucratif plafonné” - Open AI lançait GPT-2, une IA open source entraînée sur plus de 1,5 milliard de paramètres. L’intérêt ? Pouvoir générer automatiquement la prochaine séquence de texte. Un an plus tard, GPT-3 voyait le jour. Ce nouveau modèle a été entraîné sur un nombre impressionnant de 175 milliards de paramètres. Initialement en bêta fermée, Open AI a ouvert les vannes de GPT-3 au grand public en novembre 2021, entraînant par la même occasion la création d’une multiplication de start-ups qui ont développé des outils à partir de son API.
Très clairement, c’est précisément ici que la rédaction paramétrée telle qu’on peut l’expérimenter aujourd’hui prend son envol. L’idée : à partir d’un nombre limité d’”input” ou de “prompt’ (un titre, quelques mots, un paragraphe, une idée, un concept…) et en y ajoutant des paramètres tels que la tonalité, le nombre de caractères ou le niveau de langue, l’IA génère un rendu (un article, des synthèses, un call-to-action pour une landing page…).
En France, prenons l’exemple de Webedia (Allociné, PurePeople, 750g, etc.) : un ex-stagiaire, Richard Ben, a récemment publié un article où il documente les usages de GPT-3 dans le groupe média, notamment pour paraphraser ou générer des synthèses.
A terme, maîtriser ces outils sera une compétence différenciante. La fracture, déjà existante avec les étudiants qui utilisent GPT-3 pour faire leurs devoirs, va se matérialiser. Car parler aux IA pour en obtenir ce qu’on veut n’est pas aussi simple qu’il n’y paraît… Dans le domaine de la génération d’image, des places de marché et des “prompt artists” voient le jour. Leur rôle ? Vous vendre des images produites par les IA sans vous obliger à rédiger vous-même le prompt initial.
« Je me dis que peut-être que dans quelques mois, le rédacteur qui sera capable de faire des prompts sur un GPT-3 ou ses successeurs, je pense qu'il aura une sacrée longueur d'avance »
Grégory Florin, Head of SEO Marmiton / Doctissimo / Auféminin, cité dans le mémoire “Quelle place pour l’intelligence artificielle dans la production et la diffusion de contenus ?” présenté cette semaine à Sciences Po par Olivier Martinez
Un écosystème de start-ups qui se construit
Le fonds d’investissement Sequoia a dressé un mapping de l’écosystème de l’IA générative (on parle aussi de “synthetic media”), avec notamment une section consacrée aux outils de rédaction IA. La firme de VC américaine structure sa pensée autour de 6 catégories, l’une liée aux outils généralistes puis des déclinaisons verticales, notamment le marketing et le ventes.
En creusant le sujet, nous avons décidé de vous proposer une version alternative de ce mapping, en supprimant tout d’abord les acteurs généralistes comme Wordtune ou plus récemment Lex, qui, selon nous, pourraient être amenés à disparaître d’ici quelques années s’ils ne font pas évoluer leur modèles.
En effet, en 2020, Microsoft a annoncé avoir négocié avec OpenAI pour profiter d’une licence d’exploitation exclusive pour son moteur de génération de texte GPT-3. L’intégration de GTP-3 dans Word est donc à prévoir. D'ailleurs, avec Dall-e (l’autre IA d’OpenAI, dédiée à la génération d’images, qui fait grand bruit depuis son lancement en 2021 et son ouverture à tous le mois dernier), Microsoft a été encore plus rapide : il vient d’annoncer son intégration à Office. Et ce n'est pas fini : l'éditeur de logiciels est sur le point de resserrer encore plus ses liens avec OpenAI, à travers un nouvel investissement qui valoriserait la start-up 20 milliards de dollars.
Côté Google Doc, même évolution. Deepmind, le principal concurrent d’OpenAI, appartient en effet à… Alphabet ! Et l’équipe de Deepmind a très récemment documenté son travail sur la suite Google Cloud. Si Deepmind est surtout connu du grand public pour AlphaGo, qui a battu le champion du monde de jeu de Go en 2015, la start-up a aussi son propre modèle de traitement du langage, Gopher. Il compte 280 milliards de paramètres, soit 5 de plus que GPT-3. Et il s’avère plus pertinent dans la plupart des cas d’usage, à en croire le benchmark réalisé par Deepmind itself :
Scaler la production de contenus
Concrètement, on retrouve une première catégorie d’outils - la majorité des outils sur le marché aujourd’hui - qui a pour objectif principal de scaler la production de contenu et, à terme, remplacer la production de contenus à faible valeur ajoutée. Byword promet par exemple de vous fournir en quelques heures un fichier de milliers de pages SEO, à partir d’une simple liste de mots clés. Comptez 7,500$ pour 1 000 articles.
Aubaine ou désastre en vue ? Cette catégorie en plein boom (on recense plus de 40 acteurs, pratiquement tous lancés il y a moins de deux ans !) pourrait conduire à la production de contenus grammaticalement corrects, mais sans une réelle capacité d’analyse, sans différenciation notable et surtout éthiquement douteuse. En effet, s’il y a eu tout un buzz autour de la "sentience" supposée d'une IA de Google cet été (c'est-à-dire sa conscience ou plus précisément, sa capacité à éprouver une émotion), la conclusion est assez claire : on en est en fait très loin ! Un constat partagé en début de mois par Yann Le Cun, de Meta, dans un papier de recherche qui a fait beaucoup de bruit.
Rasa Seskauskaite, la fondatrice de la start-up Anta AI enfonce le clou : “Lorsque je pense à Jasper, ma première pensée est qu'il s'agit d'un modèle pré-entraîné et qu'il ne peut donc pas produire une pensée originale. Il contribue à diffuser encore plus de messages identiques à ceux qui existent déjà, mais avec des variations différentes. Plus de contenu, plus de clickbait, plus de gaspillage de notre attention” Et bientôt des pénalités Google ?
Augmenter l’humain et booster sa créativité
Mais, heureusement, on constate aussi l’essor d’outils plus spécialisés qui viennent compléter ou faciliter son travail. Ils ont vocation à augmenter l’humain en lui permettant, selon les cas, de mieux réfléchir, mieux communiquer. Bref, de faire mieux.
Avez-vous toujours rêvé d’écrire un livre avec Kafka, Austen ou encore Dostoïevski ? C’est ce sur quoi travaille Laika. La start-up de Copenhague utilise une combinaison de modèles propriétaires spécifiques et du bon vieux GPT-2 pour offrir une bibliothèque de modèles pré-réglés basés sur des écrivains et philosophes célèbres. (ndlr: Tous ces modèles sont libres de droits, bien sûr).
Cette dernière propose également d’entraîner des IA sur sa propre écriture pour créer son “partner in crime”. Et à terme échanger des “cerveaux numériques”. Sur le même créneau, mention également pour la start-up Novel AI.
Marre des salariés qui ne respectent pas le ton de la marque dans leurs communications ? La start-up Writer donne aux responsables de la marque la possibilité de diffuser et optimiser l’usage de leur brand voice auprès des salariés grâce notamment à des templates qui respectent des règles d’usage ou des terminologies précises.
A la recherche d’outils pour booster la créativité des uns et des autres ? Rasa Seskauskaite, fondatrice de la start-up Anta AI, précédemment citée, propose de renverser la logique des outils d’IA writing classique en aidant les utilisateurs à développer leur esprit critique. Elle a notamment lancé QBurst, un outil basé sur du GPT-3 qui aide les gens à tout remettre en question. “Nous pensons que le questionnement est la clé de la pensée critique et de la résolution de problèmes, et nous sommes passionnés par l'idée d'aider les gens à apprendre à le faire efficacement. Nous avons développé une approche unique pour enseigner les compétences de questionnement, et notre outil permet aux personnes de tous âges et de tous horizons d'apprendre à remettre en question tout ce qu'elles rencontrent dans la vie.”
Vous voulez que vos collaborateurs se sentent moins seuls ? A nouveau, faites appel à l’IA writing. Cela peut vous paraître étonnant mais voici ce que nous a indiqué le fondateur de Sudowrite, James Yu, dans un échange de mail : "Nos rédacteurs nous disent sans cesse que travailler avec une IA ressemble à une expérience collaborative, et il est agréable de savoir que quelqu'un (même s'il s'agit d'un modèle linguistique) lit, comprend et donne son avis sur leurs écrits."
A quoi s’attendre d’ici 2030 ?
On l’a vu, l’écriture augmentée par l’intelligence artificielle a de beaux jours devant elle. Qu’il s’agisse d'accroître la quantité, la créativité ou la fidélité de la production (et même la santé mentale du créateur), l’IA writing est déjà et sera encore davantage dans nos vies demain. Peut-être sous l’identité des start-ups citées ci-dessus, plus certainement de manière totalement intégrée et invisible dans des services déjà existants et entre les mains des géants.
Néanmoins, comme pour toute technologie, les apports cités ci-dessus ne peuvent aucunement cacher les limites auxquelles l’IA writing devra faire face. Pour les comprendre, pas besoin de se plonger en 2030. Et nous n’entrerons pas dans les détails, qui pourraient faire l'objet d’une autre (longue) newsletter. Mais notons tout de même quelques points :
D’abord, l’explosion du nombre de sociétés spécialisées dans l’IA writing va rapidement se confronter à un principe de réalité. Le coût de développement des modèles et donc leur coût d’usage devient vite extrêmement élevé (Davinci, le modèle le plus puissant de OpenAI coûte 2 centimes de dollars pour 1000 tokens, soit environ 750 mots. Notre article de 18,000 mots nous aurait coûté 4 centimes. Pas cher au premier abord, mais qu’en est-il si nous passons à un usage de masse ?). A ce sujet, 2023 devrait être une année intéressante, une sorte de début d’inflexion. Sans pour autant atteindre la rentabilité, les sociétés concernées par l’IA writing vont rapidement devoir prouver la valeur de leurs modèles économiques.
Ensuite, les appels à la régulation, et en particulier environnementale, de ces modèles se font de plus en plus entendre. L’université de Copenhague (de laquelle est issue la start-up Laïka citée ci-dessus) a d’ailleurs publié une conversion du coût écologique d'entraînement de GPT-3 en nombre de voyages vers la lune. Pour nous, ce chiffre ne veut rien dire en lui-même puisqu’il prend en compte beaucoup trop de paramètres statiques (une IA n’est pas entraînée à un seul moment, son coût d'entraînement n’est plus le même en 2023 qu’en 2020…), mais il donne des repères simples pour l’utilisateur et le citoyen.
Et cela nous amène à notre troisième et dernière limite de ces modèles : l’éthique. Les craintes sont réelles autour du développement de telles solutions. L’objection la plus souvente faite à GTP-3 par exemple est que l’IA s'entraîne sur des données issues d’internet, avec des biais prononcés sur les questions de racisme, de genre, d’opinions politiques… Mais la crainte est une chose, certainement maîtrisable par les géants derrière ces technologies, et la perception de la crainte en est une autre. On en revient alors à nouveau au constat suivant : l’avenir de l’IA writing est dans sa capacité à se rendre indispensable sans être pour autant identifiée.
—
Marie Dollé, Benoît Zante, Quentin Franque.
PS1. Si vous aimez “In bed With Tech”, vous allez adorer la newsletter de l’agence Intuiti ou travaille Quentin et la newsletter de Benoît.
PS2. Vous souhaitez obtenir un accès au fichier excel avec les infos des +80 start-ups d’IA Writing ? Contactez-moi !
passionnant, comme toujours.
Pour moi, qui avait créé une agence éditoriale pour le digital il y a 22 ans (ouh là !), cette évolution est incroyable et fascinante.
La limite semble cependant rester celle de la langue, de l'idiome. Sauf erreur, ces IA ne fonctionnent qu'en anglais : quid des autres langues ? français, mandarin, espagnol, autre...
le risque est d'avoir une IA pour écrire, et un outil bien moins intelligent pour traduire...
Merci Marie pour ce tour d’horizon détaillé. Travailler avec un outil d’lA pour la rédaction, c’est comme travailler avec un stagiaire plein d’ambition. Il est sûrement capable de produire beaucoup en un temps record mais il faut être là pour l’aiguiller et le reprendre de temps en temps. Mais ça marche. J’utilise Jasper quotidiennement !