X

Blog 16 : analyse de sentiment du sous-corpus ‘vaccination’ (en, part.2)

2022-02-02

English

Carnet de recherche

Le projet de recherche 'Mixology' s’inscrit dans la perspective de l’open research. Son objectif est de sonder les opinions en période de crise, ici à partir d’un corpus collecté via l’API de Twitter, du 12 au 31 décembre 2021.

La suite de l’analyse de sentiment du sous-corpus ‘vaccination’ en langue anglaise s’est intéressée aux ensembles formés par les catégories de tweets obtenues via la modélisation thématique (topic modeling) avec les algorithme LDA et CTM (Latent Dirichlet Allocation et Correlated Topic Model, voir Blog 9). L’analyse de sentiment a été réalisée uniquement à partir du Mixology Lexicon, qui rassemble six dictionnaires régulièrement utilisés dans l’analyse de sentiment ainsi que le Mixology Covid Lexicon, réalisé dans le cadre de cette recherche, en vue d’une adéquation des termes au domaine d’application.

La première analyse portant sur l’ensemble des tweets, ventilés par pays, montre un sentiment positif dominant pour l’ensemble des pays observés. Toutefois, il s’agit d’une courte majorité puisque le pourcentage positif le plus bas est de 49,71% pour la France et le Grand-Duché de Luxembourg, tandis que le plus haut est observé au Royaume-Uni avec 54,1%. Ces résultats montrent, dans l’ensemble, peu de différences entre les pays.

 

 

Lorsqu’il s’agit de se concentrer sur les thématiques, ces résultats sont toutefois à nuancer. Pour cette analyse, treize thématiques apparaissant comme les plus significatives ont été retenues :

  1. Antivax
  2. Booster
  3. Government
  4. Mandate (obligation vaccinale)
  5. Mask (port du masque)
  6. Media
  7. mRNA
  8. Omicron
  9. Pass
  10. Science
  11. Side effects (effets secondaires)
  12. Unvaccinated
  13. Vaccin* + Child* (vaccination des enfants)

Les résultats montrent que la tendance négative concerne surtout les thématiques des antivax (dont le sens peut être compris comme les personnes s’opposant à tous les vaccins ou aux vaccins Covid) et des effets secondaires des vaccins. Le sentiment est très mitigé en ce qui concerne les thématiques du gouvernement, de l’obligation vaccinale et des personnes non vaccinées. Le sentiment positif obtient de meilleurs résultats dans sept thématiques : booster, port du masque, médias, ARN messager, le variant Omicron, le pass sanitaire, la science (sauf au Grand-Duché de Luxembourg où l’échantillon est trop petit pour être considéré comme représentatif des opinions des Luxembourgeois sur Twitter) et la vaccination des enfants. Cette analyse souligne une polarisation des débats essentiellement en ce qui concerne le niveau politique. La vaccination obligatoire est perçue de manière plus négative en Belgique, où cette thématique s’est invitée dans le débat parlementaire. Les personnes antivax et les personnes non vaccinées sont, quant à elles, perçus de manière plus négative en Autriche et en France. Toutefois, on observe des tendances plutôt similaires d’un pays observé à l’autre.

 

Voir le graphique comparatif: https://ohmybox.info/rframe/corpus-1-vaccin-en-sentiment-lexicon/

 

Ces observations témoignent de débats autour de la vaccination qui ne relèvent pas seulement des aspects sanitaires. Par ailleurs, celles-ci seront à nuancer/affiner lors de l’analyse du sous-corpus qui porte spécifiquement sur les mesures politiques de lutte contre la pandémie. Et elles seront aussi à confronter aux observations réalisées dans le corpus général en langue anglaise (où l’étiquetage du pays n’a pas toujours été possible et dont la zone géographique est un peu plus large, mais toujours en Europe de l’Ouest), ainsi que dans les deux sous-corpus en langue française. D’ici là, il reste un important travail d’analyse à réaliser, lequel inclura davantage de machine learning, en vue de confronter/comparer/améliorer les résultats.

 

# # #

Lire aussi

Blog 21 : politiques, experts et journalistes

Blog 20 : pour la vaccination, contre les restrictions

Blog 19 : analyse de sentiment comparée

Blog 18 : une crise sanitaire et politique

Blog 17 : anatomie du sous-corpus « mesures politiques/sanitaires » (en)

Blog 16 : analyse de sentiment du sous-corpus ‘vaccination’ (en, part.2)

Blog 15 : analyse de sentiment comparée du sous-corpus ‘vaccination’ (en, part.1)

Blog 14 : un dictionnaire pour l’analyse de sentiment adapté à la crise Covid

Blog 13 : construire une liste de stop words

Blog 12 : principaux dictionnaires pour l’analyse de sentiment

Blog 11 : description statistique du corpus avec #RStats

Blog 10 : l’analyse de sentiment ou l’évaluation de la subjectivité

Blog 9 : modélisation thématique du corpus ‘vaccination’ (en)

Blog 8 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.2)

Blog 7 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.1)

Blog 6 : collecte du corpus et préparation de l’analyse lexicale

Blog 5: le package R « textclean »

Blog 4 : cibler la bonne requête et nettoyer des messy data

Blog 3 : Twitter API et rtweet

Blog 2 : collecte du corpus

Blog 1: le projet

Les enjeux de la recherche sur les usages médiatiques en temps de crise