La suite de l’analyse de sentiment du sous-corpus ‘vaccination’ en langue anglaise s’est intéressée aux ensembles formés par les catégories de tweets obtenues via la modélisation thématique (topic modeling) avec les algorithme LDA et CTM (Latent Dirichlet Allocation et Correlated Topic Model, voir Blog 9). L’analyse de sentiment a été réalisée uniquement à partir du Mixology Lexicon, qui rassemble six dictionnaires régulièrement utilisés dans l’analyse de sentiment ainsi que le Mixology Covid Lexicon, réalisé dans le cadre de cette recherche, en vue d’une adéquation des termes au domaine d’application.
La première analyse portant sur l’ensemble des tweets, ventilés par pays, montre un sentiment positif dominant pour l’ensemble des pays observés. Toutefois, il s’agit d’une courte majorité puisque le pourcentage positif le plus bas est de 49,71% pour la France et le Grand-Duché de Luxembourg, tandis que le plus haut est observé au Royaume-Uni avec 54,1%. Ces résultats montrent, dans l’ensemble, peu de différences entre les pays.
Lorsqu’il s’agit de se concentrer sur les thématiques, ces résultats sont toutefois à nuancer. Pour cette analyse, treize thématiques apparaissant comme les plus significatives ont été retenues :
- Antivax
- Booster
- Government
- Mandate (obligation vaccinale)
- Mask (port du masque)
- Media
- mRNA
- Omicron
- Pass
- Science
- Side effects (effets secondaires)
- Unvaccinated
- Vaccin* + Child* (vaccination des enfants)
Les résultats montrent que la tendance négative concerne surtout les thématiques des antivax (dont le sens peut être compris comme les personnes s’opposant à tous les vaccins ou aux vaccins Covid) et des effets secondaires des vaccins. Le sentiment est très mitigé en ce qui concerne les thématiques du gouvernement, de l’obligation vaccinale et des personnes non vaccinées. Le sentiment positif obtient de meilleurs résultats dans sept thématiques : booster, port du masque, médias, ARN messager, le variant Omicron, le pass sanitaire, la science (sauf au Grand-Duché de Luxembourg où l’échantillon est trop petit pour être considéré comme représentatif des opinions des Luxembourgeois sur Twitter) et la vaccination des enfants. Cette analyse souligne une polarisation des débats essentiellement en ce qui concerne le niveau politique. La vaccination obligatoire est perçue de manière plus négative en Belgique, où cette thématique s’est invitée dans le débat parlementaire. Les personnes antivax et les personnes non vaccinées sont, quant à elles, perçus de manière plus négative en Autriche et en France. Toutefois, on observe des tendances plutôt similaires d’un pays observé à l’autre.
Voir le graphique comparatif: https://ohmybox.info/rframe/corpus-1-vaccin-en-sentiment-lexicon/
Ces observations témoignent de débats autour de la vaccination qui ne relèvent pas seulement des aspects sanitaires. Par ailleurs, celles-ci seront à nuancer/affiner lors de l’analyse du sous-corpus qui porte spécifiquement sur les mesures politiques de lutte contre la pandémie. Et elles seront aussi à confronter aux observations réalisées dans le corpus général en langue anglaise (où l’étiquetage du pays n’a pas toujours été possible et dont la zone géographique est un peu plus large, mais toujours en Europe de l’Ouest), ainsi que dans les deux sous-corpus en langue française. D’ici là, il reste un important travail d’analyse à réaliser, lequel inclura davantage de machine learning, en vue de confronter/comparer/améliorer les résultats.