Avant de recentrer la recherche du mémoire @MaSTICulb sur la génération automatique de textes en langue naturelle (GAT), le champ plus large des processus d’automatisation dans le contexte du journalisme computationnel a été exploré. C’est dans ce cadre que Nicolas Kayser-Bril a été sollicité, notamment pour parler de Datawrapper (mais pas seulement).
Propos recueillis par e-mail le 30/09/2014
En quoi les outils d’automatisation constituent-ils une valeur ajoutée pour les journalistes ?
Nicolas Kayser-Bril : Les outils d’automatisation permettent de gagner du temps. En augmentant la productivité, ils libèrent les journalistes des tâches répétitives et leur permettent de passer plus de temps sur des tâches à plus forte valeur ajoutée comme l’enquête, la vérification d’information etc.
L’automatisation de textes, y croyez-vous et pourquoi ?
N K-B : Il n’est pas question de croire en des sociétés comme Narrative Science: elles existent et ont des clients ; l’écriture automatisée est une réalité. C’est d’ailleurs une réalité depuis très longtemps, ces sociétés ont simplement commercialisé des algorithmes existants. Au-delà de l’augmentation de la productivité, qui libère le journaliste des tâches répétitives à faible valeur ajoutée, ces technologies permettent de fournir des contenus lisibles sur des thématiques où il y a trop peu de lecteurs pour qu’un humain se charge de la rédaction de textes (rapports sur une école, rencontres sportives locales etc.).
Quelle est la philosophie qui a présidé au lancement de Datawrapper ?
N K-B : Nous étions (en 2011) frustrés de ne pas disposer d’une solution permettant d’utiliser les librairies de visualisation de données très rapidement.
Sur quelle technologie s’appuie ce système ? Serait-il possible d’obtenir une modélisation du système et de ses processus ?
N K-B : Je n’ai pas de modélisation, mais vous pouvez télécharger et installer Datawrapper sur votre propre machine depuis Github (c’est assez facile, comptez de 30 à 90 minutes).
Pour lancer un outil de visualisation à destination des journalistes, qu’est-ce qui a été le plus important à prendre en compte ?
N K-B : La vitesse et la justesse. Les journalistes sont des gens pressés. Datawrapper se devait de permettre de réaliser des visualisations en moins d’une minute. La justesse est plus compliquée. De nombreux services mettent en avant l’esthétique. Or, quand on est journaliste, on veut que le lecteur se souvienne du message, pas de la visualisation.
Avez-vous intégré des règles de sémiologie graphique ?
N K-B : Oui. La majeure partie des règles de visualisations utilisées dans Datawrapper viennent des travaux de Dona Wong.
Quelle est, à votre sens, la limite de Datawrapper ? Souhaitez-vous continuer à développer l’outil et si oui, comment ?
Datawrapper n’est pas parfait, n’hésitez pas à envoyer votre feedback à info@datawrapper.de! L’outil est développé entièrement, depuis novembre 2013, par Journalism++ Cologne, l’un de nos franchisés.
Avez-vous une estimation du nombre de ses utilisateurs ?
N K-B : Près de 25,000 utilisateurs sur la version en ligne et plusieurs milliers d’autres sur des versions hébergées directement.
La technologie au service des journalistes : ressentez-vous de réticences ? Cela suppose-t-il de nouvelles compétences ?
N K-B : Comme n’importe quelle innovation, les technologies qui arrivent dans le monde des journalistes créent des tensions. Nous créons des outils pour permettre aux journalistes de travailler sur des tâches à forte valeur ajoutée, mais un patron peut très bien décider d’utiliser ces augmentations de productivité pour licencier. Les compétences à valeur ajoutée aujourd’hui ne sont pas celles d’il y a 30 ans ou même 5 ans ; le besoin d’adaptation est très fort. Mais rien de cela n’est nouveau: la composition manuelle était indispensable depuis le XVIe siècle et s’est retrouvée inutile à la fin du XIXe siècle. Même chose pour la maquette, réalisée à la main jusqu’à l’arrivée de la micro-informatique et des dizaines d’autres compétences.
Comment réussir à intégrer une manière plus computationnelle de penser l’information ?
N K-B : La numérisation des contenus a changé radicalement la manière de penser l’information. On peut aujourd’hui structurer toute l’information, c’est à dire, pour un journaliste, de d’abord rentrer des informations dans une base de données avant d’écrire un article. Nous avons développé un outil pour permettre aux rédactions de passer facilement le cap, Detective.io.