Chat GPT et Content Marketing:

Mariage parfait ou grande illusion ?

Retour sur Chat GPT, l'IA qui défraie la chronique

ChatGPT est maintenant sorti depuis le 30 novembre dernier, et a marqué un tournant dans le développement des technologies de traitement des langues, grâce à une IA.
ChatGPT est une Intelligence Artificielle, l'élément "Chat" étant sa part conversationelle et "GPT" les initiales de "Generative Pre-trained Transformer" (transformeur génératif pré-entraîné) d'OpenAI. GPT-3 est le troisième langage d'IA pour cette société travaillant en open source, qui vient de créér un prototype, d'agent conversationnel utilisant l'intelligence artificielle. Comme le dit le site officient OpenAI: "Nous avons formé un modèle appelé ChatGPT qui interagit de manière conversationnelle.

Le format de dialogue permet à ChatGPT de répondre aux questions de suivi, d'admettre ses erreurs, de contester les prémisses incorrectes et de rejeter les demandes inappropriées. ChatGPT est un modèle frère d'InstructGPT, qui est formé pour suivre une instruction dans une invite et fournir une réponse détaillée." En termes simple c'est un "robot" répondant à toutes les questions et auto-apprenant au fil de ses interactions avec le public. Etant un projet open source nulle besoin de payer l'application (pour l'instant, voir plus loin). Elle est ouverte à tous et toutes sur cette adresse: OpenAI. En fait en conversant avec l'IA on travaille gratuitement pour la société OpenAI... Comme le dit Patrick Flandrin, directeur de recherche du CNRS, "c’est un programme dont l’ambition est de passer le test de Turing".




La mise en place est d'une grande simplicité: On entre son adresse mail, on conforme par téléphone pour l'accés et on précise noms et prénoms. A partir de là l'application est simple à utiliser. Mais l'intérêt ne s'arrête pas aux performances apparentes de cet agent en terme d'un apprentissage supervisé et d'apprentissage par renforcement. C'est le fait qu'il peut générer du texte à volonté sur la base d'une requête. L'intérêt est effet c'est la génération de contenu qualifié pour le "remplissage" de sites internets, entre pages de contenus et news. En clair, c'est un nouveau moyen de faire du content marketing.

En effet, si GPT 1 et 2 produisaient du texte à partir de bouts de phrases récupérées sur internet (certains robots aspirateurs et combinateurs ainsi que de "spinning" le faisaient déjà pour la communauté SEO blackhat). Mais ce côté "perroquet" produisait au final un texte original en paraphrasant et combinant plusieurs éléments repris de nombreux textes, déjà propre à alimenter des contenus. Ce que fait GPT3 est de bien mieux comprendre le sens de la question et d'y ajouter dans sa réponse des recherches plus poussées. En clair pour un professionnel du SEO, GPT-3 est l'instrument parfait pour la "longue traîne". On y reviendra.

Si ChatGPT à fait controverse dans la presse, c'est pour des raisons parfois très différentes. Voici quelques coupures de presse:
-Violation droits d'auteur: "ChatGPT accusé d'avoir aspiré des articles de presse pour enrichir sa base de données" (Les numériques 17/02/23)
-Fake News: "ChatGPT: la capacité de l’IA à renforcer la désinformation" (agence sciencepresse.ca Mardi 24 janvier 2023)
-La relance d'une concurrence effrénée entre Bing et Google: "Comment ChatGPT a provoqué une « course à l’armement »" (La presse.ca, 4 Février 2023)
-Des accusations de "ChatGPT est Woke" par la presse conservatrice US
-ChatGPT accusé de donner aux étudiants/collégiens un moyen de rédaction facile (nombreux articles)

ChatGPT comme générateur de contenus



ChatGPT en version 3.0 n'est dont plus une simple application et modèle de langage capable de générer du texte au kilomètre, mais d'un véritable système de dialogue, ce qui va permettre d'affiner la génération de contenus sur des requêtes complexes que même Google n'est pas capable de rendre dans ses résultats. C'est bien sûr avantageux pour la "longue traîne", que les professionnels du web définissent comme une URL (adresse de page) longue et complexe, avec de nombreux mots-clés. Celà à de l'importance sur le plan du SEO pour une raison très simple:

En SEO, surtout pour un site qui débute, il est très difficile de percer (d'arriver haut dans les résultats de recherche) sur une requête concurrentielle, à savoir très demandée. Le mots-clés "assurance" ou "real estate" par exemple sont parmi les plus chers du monde. Les batailles pour la première place sont épiques et se font à coup de millions ou même de milliards d'euros ou de dollars.

En revanche, plus la requête est précise (dans le jargon du référencement on parle de "sniper") et plus statistiquement les chances d'arriver dans le top ten sont grandes, même pour un site débutant. Produire du contenu de qualité pour son site est une des stratégies pour percer, car il faut que Google sente un volume sémantique suffisant pour se faire une idée de la qualité du site qu'il va placer dans un résultat de recherche "naturel" (aucune publicité).

Le contenu aura deux aspects intéressants: Agrandir cette base de contenus contenant les mots-clés choisis, et si fait sur une base régulière, rafraîchir le contenu indexable. Combiné avec les deux autres piliers stratégiques du référencement, le contenu sera relayé sur les réseaux sociaux comme caisse de résonnance, et si répondant bien aux requêtes des internautes, pourra générer des liens spontanés (Popularité). Le reste est une affaire de temps et de constance.




Mais il est clair que la matière première de construction d'une site internet, c'est bien son contenu. Et pas visuel. On ne le répétera jamais assez mais les robots Google se fichent bien de l'esthétique ou des images. Ce qui lui importe est que le site soit rapide, que les internautes trouvent leur chemin. Si image il y a, il faut qu'elle soit rapides à charger et que le descriptif soit bien renseigné et cohérent avec le reste. En matière de contenu de toute façon ChatGPT peut en produire des quantités industrielles, dans la langue de son choix, avec une bonne syntaxe et aucune faute d'orthographe. Cela permet donc aussi de gagner du temps en correction.

Certes, ChatGPT à ses limites de "bienséance" telles que codées au départ pour éviter les dérapages certainement médiatiques de la machine (on se souvient encore des tentatives de microsoft ! - d'ailleurs ce dernier est le principal investisseur d'OpenAI, on retient ses leçons.): On ne pourra le forcer à décrire l'assemblage d'une bombe, de générer des argumentaires conspirationnistes, révisionnistes ou suprémacistes, ou bien de remplir un site pornographique de textes bien salés (note que je n'ai pas testé pour ne pas être bloqué).

Pour en revenir à l"intêrét de Microsoft pour ChatGPT, il peut être interfacé avec un moteur de recherche existant, comme Bing en l'occurence. Etant plus fin en apparence que Google, ce serait un concurrent parfait pour le moteur de Mountain View qui règne sans partage depuis presque deux décades. En effet ChatGPT serait capable de fournir directement une réponse structurée et rédigée à la question posée, contrairement à Google search, qui ne fait que pointer du doigts ses sites et pages les plus "pertinentes" sans pour autant bien comprendre la requête. Mais pour en revenir à la génération de contenu, il faut savoir que plus fine est la requête, moins longue sera la réponse, ce qui est un frein à la création par exemple de pages entières basées sur des URL en "longue traîne". Mes propres tests n'ont permi que de générer des textes de 300 mots au mieux, plus souvent de 100. Si le code de la page qui abrite le texte est considérable, on va se retrouver avec un ratio de 1/10 en défaveur du texte par rapport au code, jamais un bon signal de pertinence.

Le Bilan:



Si ChatGPT génère des réponses sensées, le concept même n'à pas encore été testé et pose plus de questions aux scientifiques, professionnels et passionés sur ses possibles applications qu'il n'en résoud... Par exemple, le test de générer deux fois un texte avec une même requête fonctionne et permet de générer du texte façon "spinning" (clonage paraphrasé). Cela permet de remplir une page avec un même contenu rédigé différemment et renforcer sa pertinence aux yeux de google, réduire le ratio texte/code, ect. Souvent les outils de spinning sont beaucoup plus rudimentaires créent une "bouillie" qui ne fait pas grand sens et qu'il faudra rerédiger. Pas ChatGPT.

Il y à des limites au système, forcément. Premièrement les informations données ne sont pas forcément justes et les sources non indiquées. La fiabilité des contenus produits est dont proche de zéro car il n'est pas communiqué si les sources choisies pour rédiger le contenu viennent de sources réputées ou bien populaires. La seconde est moins importante et concerne "l'orientation", la vision du monde insuflée au logiciel par les développeurs pour éviter de répéter les erreurs du passé. Enfin, quelles sont réellement les limites de ce qui est "acceptable" comme question, les topics à éviter, etc. Certains domaines non-consensuels, de nature à être démonétisés sur Youtube par exemple seraient-il acceptés ? Pour cela il faudrait un autre robot "questionneur" pour conversationner sur le long terme et rendre des statistiques. A ma connaissance cela n'a pas été fait. Il n'à pas été testé non plus le volume de requêtes possibles chaque jour, par heure, etc. Pour un rédacteur pro générant du contenu pour des dizaines de sites par jour, c'est une vraie question.

On à également reproché au robot ses limites épistémiques, certains chercheurs clairement dénonçant le fait que ChatGPT "ne comprend pas ce qu'il dit et se fiche de la vérité". Un autre, Jocelyn Maclure, va même le qualifier de "baratineur". Si le robot garder toujours son calme, obéis avec empressement et s’excuse avec humilité, j'ai pu voir que sur certains sujets voisins (ici des classes de sous-marins de plusieurs générations portant le même nom) j'ai du reformuler la requête quatre fois pour avoir ce que je cherchait.

Et à quand les robots de Google seront capables de détecter un texte rédigé par ChatGPT et attribuer au contenu une note dégradée ? L'avenir nous le dira. Ce qui est sûr c'est qu'il y à une "fenêtre de tir" pour pouvoir rapidement renforcer les contenus de ses sites à moindre frais, maintenant. Cela compense la dévaluation du contenu suite au COVID, à la guerre en ukraine et ses conséquences sur l'écroulement du marché de la publicité (en clair les revenus ne valent plus que le dixième de ce qu'ils étaient en 2018).

Enfin et surtout ChatGPT est victime de son succés. Il réussit là ou BlenderBot (Meta) et Galactica (idem) ont échoué récemment. Le site à été indisponible pendant une semaine en Février et en Janvier, le temps pour le CEO d'OpenAI, Sam Altman, de recruter du personnel et mettre en plae plus de serveurs pioyr répondre à la demande, fulgurante. C'était un pari risqué, cette mise en public, et pas forcément approuvée pour le personnel de la compagnie. Pour éviter les pertes financières, Altman envisage même un abonnement mensuel au volume de 20 $ US, appelé ChatGPT Plus. Ce qui serait utile au vu effectivement du temps gagné en rédaction par rapport à des outils SEO de "scrapping" spécialisés plus anciens et repérés par google sur le "duplicate content".

L'arrivée de ChatGPT et l'annonce de son couplage avec Bing à donc sonné l'alarme chez Google, qui se focalise sur une refonte de son moteur, nulle doute avec des acquisitions prochaines à prévoir. Les mois qui arrivent promettent d'êtres intérressants vu la saturation du contenu depuis 2014. Il faudra donc marier dicernement et expertise pour se différencier de la concurrence tout en utilisant ChatGPT pour gagner du temps. C'est donc une aide, un outil qui doit être apprivoisé, non une solution complète.

Sources

GPT-3
ChatGPT wiki
Open AI site officiel
lepoint.fr
academie-sciences.fr
lapresse.ca, la course à l'armement
lapresse.ca: Jocelyn Maclure: ChatGPT le baratineur
Comment utiliser directement ChatGPT dans Google - Presse-citron.net
markettailor.io - How businesses can use ChatGPT for content marketing
Rockcontent.com - The AI Paradox: The Impact of ChatGPT on Content Marketing
Forbes - How Brands Can Use ChatGPT And Other Generative AI For Content Marketing
aleciahancock.com - Using ChatGPT to write your marketing content for you
searchenginejournal.com - ChatGPT For Content and SEO?
exob2b.com - ChatGPT pour le marketing de contenu : Puissant mais pas au point!
blogdigital.fr/chat-gpt-creation-contenus
lafabriquedunet.fr/blog/chatgpt-cas-usage-marketing-contenus
webseodigital.com - Comment ChatGPT transforme la façon dont nous créons et consommons du contenu