X

Typologie de l’approche par données dans le journalisme

Laurence Dierickx

2015-06-27

L’approche par données dans le journalisme [1] compte plusieurs avatars, lesquel vont du journalisme assisté par ordinateur à la rédaction automatique, en passant par le datajournalisme et le journalisme computationnel.

Typologie de l’approche par données dans le journalisme

Si les journalistes ne ressentent pas le besoin de catégoriser leurs pratiques, observe Coddington, il estime pourtant nécessaire pour les chercheurs de dresser des typologies [2].

Journalisme de précision
Traitement informatique de données dans un contexte journalistique, en y conjuguant des méthodes des sciences sociales (sondage, par exemple). Rupture avec le nouveau journalisme, qui privilégie une forme narrative empruntée à la fiction : la science contre la littérature [3]. L’informatique permet de trouver des faits, de déduire des causes [4].
Naissance : fin des années 1960.

Journalisme assisté par ordinateur (JAO)
Héritier du journalisme de précision, désigne un travail d’investigation s’appuyant sur des données (analyses statistiques, croisements de données, requêtes dans bases de données relationnelles) [5]. Appelé, en anglais, Computer Assisted Reporting (CAR).
Naissance : début des années 1980.

Datajournalisme
Le journalisme de données ne réinvente pas les techniques du journalisme de précision ou du JAO mais il compose « avec les outils et pour les audiences de notre époque » [6]. Lui aussi s’appuie sur les bases de données dans le cadre de la collecte, du traitement et de la production de l’information. Le changement porte sur la diffusion, à l’aide d’outils interactifs. Les contenus que les journalistes de données conçoivent « sont désignés sous le terme de ‘news applications’ qui désignent aussi bien des cartes interactives, des infographies, des bases de données interrogeables et d’autres formes de présentation en ligne » [7].
Pour Simon Rogers, fondateur du Guardian Data Blog,  le datajournalisme, c’est « 80% de transpiration, 10% de grandes idées et 10% de ‘sortie’ (output) ». Mais, souligne-t-il, il ne s’agirait pas de réduire le journalisme de données aux seuls graphiques et visualisations. Le datajournalisme, c’est raconter une histoire de la meilleure manière possible. « Parfois, cela peut être une visualisation ou une carte. (…) Parfois, publier les nombres est suffisant. »
Considéré comme un avatar du journalisme computationnel, et comme un autre point de rencontre entre les sciences sociales, l’informatique et la communication [8].
Naissance : début des années 2000.

Journalisme computationnel
Combinaison d’algorithmes, de données et de la connaissance des sciences sociales pour compléter la fonction de responsabilité du journalisme [9]. Le terme ”computational journalism” apparaît pour la première fois en 2006, au Georgia Institute of Technology, à l’occasion d’un cours dispensé par le professeur Irfan Essa. Appelé aussi « nouvelle algorihmique » [10], couvre l’ensemble du processus journalistique : de la détection de breaking news à la publication personnalisée, en passant par la sélection de l’information, le fact-checking, la hiérarchisation des contenus et la génération automatique de textes.
Naissance : milieu des années 2000.

Journalisme automatique
Avatar du journalisme computationnel. Désigne la rédaction automatique mais aussi une automatisation de la diffusion de contenus (sélection, hiérarchisation automatiques). A l’exception de la GAT, Diakopoulos relève que trois types d’algorithmes sont essentiellement à l’œuvre dans les contenus journalistiques en ligne : la prioritarisation (contenu qui attire l’attention), l’association (qui marque la relation entre les entités) et les filtres (inclusion ou exclusion de certaines informations) [11].
Naissance : années 2000.

Rédaction automatique
Avatar du journalisme automatique. Production automatisée d’actualités journalistiques à partir de données structurées [12]. Branche du journalisme computationnel [13]. Application de la génération automatique de textes (GAT) dans un contexte journalistique (branche du traitement automatique du langage, TAL). Les articles rédigés de manière automatique « transforment des statistiques en articles clairs et grammaticalement corrects en moins de temps qu’un journaliste » [14].
Naissance : fin des années 2000.

La typologie des journalistes s’inscrivant dans l’axe d’une approche par données, telle que proposée par Coddington (schéma ci-dessous [15]), met en lumière les différences entre le journalisme assisté par ordinateur, le journalisme de données et le journalisme computationnel. Pour le chercheur, le journalisme computationnel serait davantage connecté, opaque et orienté vers de larges jeux de données. A contrario, le journaliste assisté par ordinateur se démarquerait par sa transparence et s’intéresserait davantage aux échantillons de données. Quant au journalisme de données, le chercheur estime qu’il est lui aussi orienté vers de larges jeux de données tout en étant lui aussi connecté… mais plus transparent.

Typologie de Coddington

Références

[1] Carlson Matt. The robotic reporter. Digital Journalism, 2(4) :1–16, 2014.

[2] Coddington Mark. Clarifying journalism’s quantitative turn. Digital Journalism, pages 1–18, 2014.

[3] Meyer Philip. Precision journalism : a reporter’s introduction to social science methods. A Midland book, MB-163. Indiana University Press, 1973

[4] Dagiral Eric and Parasie Sylvain. Data-driven journalism and the public good : ”computer-assisted-reporters” and ”programmer-journalists” in Chicago. New Media Society, 15(6) :853–871, novembre 2012.

[5] Cox Melisma. The development of computer-assisted reporting, a paper presented to the newspaper division. In Southeast Colloquium, University of North Carolina, Chapel Hill, mars 2000. Association for Education in Journalism and Mass Communication.

Howard Alexander. The art and science of data-driven journalism (report). Tow Center for digital journalism, mai 2014.

[6] Joannes Alain. Bases de données et visualisation de l’information. CFPJ Editions, 2010.

[7] Dagiral Eric et Parasie Sylvain. Des journalistes enfin libérés de leurs sources ? Promesse et réalité du ”journalisme de données”. Sur le journalisme, 1(2) :52–63, 2013.

[8] Flew Terry, Daniel Anna, et Spurgeon Christina. The promise of computational journalism. In Media, Democracy and Change : Refereed Proceedings of the Australian and New Zealand Communications Association Annual Conference, pages 1–19, Canberra, 2010. Australia and New Zealand Communication Association

[9] Turner James T. et Hamilton Fred. Accountability through algorithm : Developing the eld of computational journalism. Duke University, Stanford University, Center For Advanced Study in the Behavioral Sciences, juillet 2009.
Turner James T., Hamilton Fred, et Cohen Sarah. Computational journalism. Communication of the ACM, 54(10) :66–71, octobre 2011.

[10] Carlson Matt, idem (1)

[11] Diakopoulos Nicholas. Algorithmic accountability. Digital Journalism, 2(4) :1–18, 2014.

[12] Robot-journalisme et production automatisée de contenus : bilan des premières initiatives et perspectives pour les médias. Satellinet, 224, décembre 2014.

[13] Carlson Matt, ibidem (1)

[14] Steiner Christopher. Automate This : How Algorithms Took Over Our Markets, Our Jobs, and the World. Penguin Group US, 2012.

[15] Coddington Mark, idem (2).

# # # #