Pendant le 1er tour des élections départementales françaises du 22 mars 2015, pas moins de 36 000 articles ont été produits et publiés sur le site du Journal Le Monde, recensant les résultats des bureaux de votes de 30 000 communes.
Même une armée de journalistes aurait été bien en peine de fournir autant d'informations en ligne sur un aussi court laps de temps.
A l'origine de cette performance, un robot d'un nouveau genre : un robot-rédacteur
Course à l'info toujours plus instantanée, souhait de rétention des internautes, référencement naturel et poids sémantique des contenus... Autant de raisons qui expliquent l'extraordinaire (qui deviendra ordinaire) dispositif choisi par Le Monde le week-end des 21 et 22 mars 2015 pour fournir sur simple requête le contenu des résultats électoraux correspondant à chaque code postal :
L'exemple du 1er canton de Fougères (Ille-et-Vilaine) :
Un libellé apparaît au bas de l'article : "Ces textes ont été écrits en collaboration avec Data2Content..."
En effet, le journal Le Monde a fait appel à une société de production de contenus, Data2Content, qui s'appuie sur des développeurs et linguistes pour programmer des robots rédacteurs.
Ceux-ci sont capables de fournir un contenu dit "humain", c'est-à-dire intelligible et cohérent sémantiquement, correctement formaté syntaxiquement, grammaticalement et orthographiquement, et unique par sa combinaison de termes.
Ils s'appuient sur une base de données, qui leur fournit les datas des champs à partir desquels les textes vont être rédigés, en combinant aléatoirement l'ordre des champs d'informations.
Exemple de caractéristiques de la bases de données pour les articles du Monde :
- nom de la commune concernée,
- code postal,
- département,
- région,
- candidats en lice,
- étiquettes politiques,
- nombre de votants,
- nombre de voix exprimées pour chaque candidat etc.
Cela peut aussi bien s'appliquer à d'autres domaines d'activités qui nécessitent la génération de contenus multiples à partir des variables d'un format de données.
C'est une relative "première" en France, puisque jusqu'à présent, une telle production de contenus de masse ne se faisait que grâce à des rédacteurs souvent basés off-shore, et des logiciels de "content spinning" dont les résultats, pour ces derniers, sont incohérents pour un lecteur humain (sans doute aussi pour les robots les plus évolués de Google...). Et surtout, dans de tels délais de production...
Sur son site, la société Data2Content affiche un tableau de comparaison des solutions de production de contenus éditoriaux, en laissant entendre que son service est le meilleur de toutes les solutions actuellement disponibles :
Un petit bémol néanmoins : le rédacteur web obtient une mauvaise note concernant le critère unicité de la qualité SEO. Valeur à nuancer voire à inverser totalement, car de ce point de vue, 1 sujet peut être rédigé de 500 manières s'il y a 500 rédacteurs humains.
D'autre part, et c'est ce qui nous différenciera (ouf) d'un robot jusqu'à l'infime : l'émotionnel.
Le traitement d'un contenu en effet, ne semble pas pouvoir être nuancé ni contrasté par un robot-rédacteur, qui ne mettra jamais d'états d'âme, de sentiments ou d'émotions dans ses textes.
Les journalistes peuvent en être heureux, et ainsi se concentrer sur l'aspect qualitatif de leur métier : l'analyse, le commentaire, le point de vue, la sensibilisation, le sens subjectif de l'évolution...
Je tiens a démentir toute information comme quoi je serai un robot #dep2015 cc @vincentglad @paul_denton
— Helene Bekmezian (@Bekouz) 23 mars 2015
... sans oublier l'orthographe ni la conjugaison du conditionnel. Surtout pour les journalistes parlementaires au Monde ;-)
content spinning : réécriture automatisée d'un article en changeant aléatoirement les termes, expressions et tournures syntaxiques
1 Commentaire sur Robots rédacteurs et SEO : Le Monde Départementales 2015
Paul Vengeons le 27/10/2021 à 20:36:07 Répondre