Blog 19 : analyse de sentiment comparée

Comme cela a déjà été constaté(voir Blog 10, Blog 12 et Blog 13), les résultats d’une analyse de sentiment s’appuyant sur une approche par lexique peuvent varier considérablement selon le lexique utilisé. Dans cette recherche, deux constats se sont confirmés : plus un dictionnaire se trouve en adéquation avec le domaine d’application, plus les résultats seront précis. A cela, ajoutons que le nombre de termes inclus dans le lexique est tout aussi important, en ce sens que la langue n’est pas limitée à une poignée de mots, et que cette richesse du langage doit aussi être reflétée. Dans l’analyse de sentiment comparée pour l’ensemble du sous-corpus « mesures sanitaires », les observations ne peuvent conduire à affirmer qu’un type de sentiment l’emporte plus largement qu’un autre, sans considération du lexique utilisé. Si l’on s’en tient à la moyenne des scores obtenus par type de sentiment, le sentiment négatif totalise 37,43%, contre 44,75% pour le sentiment positif. Cette absence d’écart significatif confirme une tendance à la polarisation des débats, déjà observée en ce qui concerne les débats autour de la crise Covid, qu’elle soit considérée sous l’angle politique ou sanitaire. Toutefois, ceci doit être affiné en fonction du pays d’origine des tweets mais aussi de la thématique abordée.

Vous trouverez ci-dessous, la fonction R utilisée pour procéder à une analyse de sentiment comparée, laquelle inclut sept lexiques en langue anglaise, dont les deux lexiques (Mixology Lexicon et Mixology Covid Lexicon) développés dans le cadre de cette recherche (voir Blog 14).

Blog 19 : analyse de sentiment comparée

Carnet de recherche

Lire aussi

Blog 21 : politiques, experts et journalistes

Blog 20 : pour la vaccination, contre les restrictions

Blog 19 : analyse de sentiment comparée

Blog 18 : une crise sanitaire et politique

Blog 17 : anatomie du sous-corpus « mesures politiques/sanitaires » (en)

Blog 16 : analyse de sentiment du sous-corpus ‘vaccination’ (en, part.2)

Blog 15 : analyse de sentiment comparée du sous-corpus ‘vaccination’ (en, part.1)

Blog 14 : un dictionnaire pour l’analyse de sentiment adapté à la crise Covid

Blog 13 : construire une liste de stop words

Blog 12 : principaux dictionnaires pour l’analyse de sentiment

Blog 11 : description statistique du corpus avec #RStats

Blog 10 : l’analyse de sentiment ou l’évaluation de la subjectivité

Blog 9 : modélisation thématique du corpus ‘vaccination’ (en)

Blog 8 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.2)

Blog 7 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.1)

Blog 6 : collecte du corpus et préparation de l’analyse lexicale

Blog 5: le package R « textclean »

Blog 4 : cibler la bonne requête et nettoyer des messy data

Blog 3 : Twitter API et rtweet

Blog 2 : collecte du corpus

Blog 1: le projet

Les enjeux de la recherche sur les usages médiatiques en temps de crise