X

Blog 10 : l’analyse de sentiment ou l’évaluation de la subjectivité

2022-01-14

English

Carnet de recherche

Le projet de recherche 'Mixology' s’inscrit dans la perspective de l’open research. Son objectif est de sonder les opinions en période de crise, ici à partir d’un corpus collecté via l’API de Twitter, du 12 au 31 décembre 2021.

L’analyse de sentiment est une technique de fouille de textes qui traite de l’analyse et de la classification des opinions subjectives. Régulièrement utilisée pour sonder les opinions véhiculées sur les réseaux sociaux, elle se décline en différentes approches. Mode d’emploi.


Vous n’êtes pas familier du machine learning ? Lisez d’abord ceci !

L’opinion publique représente les points de vue et désirs de la majorité d’une population à propos politique, commerciale, sociale ou autre (El Barachi et al., 2021). ‘L’opinion publique porte une sorte de contradiction syntaxique interne : alors que le terme public désigne le groupe et l’universel, celui d’opinion est généralement associé à l’individu et considéré comme une formulation interne et subjective.’ (Glynn et Huge, 2008). Il s’agit donc d’un concept relativement large, qui recouvre aussi les concepts de sentiment, d’évaluation, d’appréciation ou d’attitude. De plus, l’opinion peut être unique ou constituer un ensemble d’avis. Un sentiment peut être, quant à lui, défini comme un état de conscience affectif qui résulte d’émotions (Cambria et al., 2017).

L’analyse de sentiment (sentiment analysis) ou l’exploration d’opinions est une discipline relevant du text mining et de l’opinion mining, qui traite de l’analyse et de la classification des opinions subjectives, des sentiments et des émotions des personnes envers les produits, les organisations, les individus et d’autres sujets (Medhat et al., 2014 ; Keshavarz et Abadeh, 2017). S’appuyant sur un traitement automatique du langage (TAL), elle est étudiée dans une hétérogénéité de domaines d’applications (politique, marketing, business, sociologie …) (Mowlaei et al., 2020 ; Parvin et al., 2021)/ Elles est régulièrement utilisée pour étudier les opinions d’internautes s’exprimant sur les réseaux sociaux, voire pour prédire des résultats d’élection, dès lors qu’elle facilite la compréhension des données qui en sont extraites (Chauhan et al. 2021 ; Dang et al., 2020 ; Jain, 2021).

La polarité et l’intensité sont deux composants utilisés pour marquer l’analyse de sentiment. La polarité indique généralement si le sentiment est négatif, neutre ou positif ; tandis que l’intensité indique la force relative du sentiment (Dang et al., 2020).

Dictionnaire vs corpus

L’analyse de sentiment peut être abordée selon deux approches : basée sur un dictionnaire (ou un lexique) qui comprend une collection de termes auxquels sont attribués un score (Zhang et al., 2018 ; Rice et Zorn, 2021) ; et basée sur un corpus, annoté ou non (c’est-à-dire, comportant des termes d’opinion et des règles syntaxiques, dans le cadre d’annotations), qui servira de base à des opérations de classement dans un schéma d’apprentissage supervisé ou non-supervisé (Dang et al., 2020 ; Jain, 2021).

Pour Medhat et al. (2014), un schéma d’apprentissage supervisé est moins efficace qu’une approche basée sur un dictionnaire, en raison de sa complexité. En effet, il est difficile de préparer un corpus énorme qui couvre l’ensemble des termes d’une langue données. Toutefois, il présente l’avantage d’aider à trouver des domaines et des contextes spécifiques. Pour d’autres chercheurs, il s’agit d’un schéma généralement plus précis, bien que beaucoup plus lent que les méthodes basées sur un dictionnaire ou un lexique en raison des activités d’annotation (Augustyniak et al., 2015 ; Khoo et Johnkhan, 2018). Toutefois, d’autres estiment qu’un schéma d’apprentissage supervisé ne donne pas lieu à des résultats suffisamment performants (van Atteveldt et al., 2021).

Dans un schéma d’apprentissage non supervisé, les informations utilisées pour l’apprentissage des données ne sont ni classées ni étiquetées. L’objectif de cette méthode est de modéliser les données sous-jacentes pour en apprendre davantage sur l’ensemble de données (Jain, 2021). On y retrouve des méthodes basées sur le clustering, qui permettent un regroupement de données et peuvent produire des résultats précis sans aucune intervention humaine ; et des méthodes d’association, qui permettent d’explorer les relations entre de grandes portions de données lorsqu’il s’agit d’une base de données dont le volume est conséquent (Jain, 2021).

Bien qu’il soit admis qu’une approche hybride – qui combine des approches basées sur le lexique et l’apprentissage automatique – donne potentiellement lieu à de meilleurs résultats (Prabowo et Thelwall, 2009 ; Jain, 2021 ; Hardeniya et Borikar, 2016), une approche par lexique est la plus indiquée en cas d’insuffisance ou d’absence de données d’entraînement (Khoo et Johnkhan, 2018) ou pour traiter de petits corpus (Deng et al., 2017). Par ailleurs, certains chercheurs estiment que l’utilisation d’un lexique est plus reproductible à d’autres contextes que celle d’un classificateur appliqué à un problème pour lequel il n’a pas été formé (Turner et al., 2021).

Limites d’une approche par lexique

Dans une approche par lexique, l’analyse de sentiment est généralement effectuée dans une détection de subjectivité et une affectation de polarité en deux phases. Tout d’abord, la détection de subjectivité, qui se rapporte au sujet vers lequel le sentiment est dirigé, et la polarité attribuée à l’aide d’un lexique ou dictionnaires (Hardeniya et Borikar, 2016).

S’ils présentent l’avantage d’être prêts à l’emploi (Rice et Zorn, 2021), les lexiques ne tiennent pas compte de l’ensemble des domaines d’application – ce qui serait d’ailleurs pratiquement impossible – et peuvent conduire à des résultats erronés ou non valides (Grimmer et Stewart, 2013). De plus, la quantité de termes qu’ils contiennent n’est pas toujours suffisante pour rencontrer toute la richesse d’une langue qui compte des dizaines de milliers de mots.

C’est pourquoi van Atteveldt et al. (2021) recommandent d’utiliser un maximum de dictionnaires lors d’une analyse de sentiment, voire d’envisager de personnaliser un dictionnaire existant ou de créer son propre dictionnaire. Mais construire un dictionnaire prend du temps et se pose également toute la question de sa validation, dès lors qu’il est compilé sous surveillance humaine (Grimmer et Stewart, 2013 ; Rice et Zorn, 2021 ; Mowlaei et al., 2020 ; Deng et al., 2017 ; Bagheri et al., 2013).

Constituer un lexique original peut être envisagé de manière dynamique, via des algorithmes de classement automatisé – par exemple, le Naive Bayes ou le Support Vector Machine régulièrement utilisés pour des opérations de classification (Bonta et al., 2019 ; Medhat et al., 2014). Ici, il s’agit d’entraîner un classificateur sur un corpus étiqueté ou annoté (Keshavarz et Abadeh, 2017). Cette forme d’apprentissage supervisé présente l’avantage de donner lieu à des lexiques contextuels. Toutefois, elle nécessite un nombre conséquent de données pour bien fonctionner.

Les limites d’une approche par lexique sont plurielles :

1) les lexiques couramment utilisés sont généraux et ne tiennent pas compte du contexte dans lequel le terme est employé, alors que le sens des mots et du sentiment dépend précisément du contexte ;

2) les lexiques sont donc souvent insuffisants et manquent de termes adaptés au domaine d’application ;

3) ils ne traitent pas très bien les sémantiques ambigües (par exemple, dans le contexte de la crise Covid, ‘être testé positif’ n’a rien de positif ou ‘le gouvernement est formidable’ peut autant évoquer un sentiment positif de l’auteur, au premier degré, ou négatif, vu sous l’angle d’un second degré ironique) ;

4) un terme jugé positif peut devenir négatif au fur et à mesure de l’évolution du domaine d’application ;

5) un terme jugé positif dans un domaine d’application peut l’être de manière négative dans un autre domaine ;

6) la constitution d’un lexique original prend du temps lorsqu’elle est entreprise manuellement ;

7) la négation n’est pas traitée dans une approche reposant uniquement sur des unigrammes alors que celle-ci inverse la polarité de la phrase ;

8) une phrase peut ne contenir aucun sentiment, comme dans le cas de certaines phrases interrogatives (Khoo et Johnkhan, 2018 ; Liu, 2012 ; Deng et al., 2017 ; Jain, 2021 ; Mejova, 2009 ; Hardeniya et Borikar, 2016).

De plus, un sentiment exprimé dans une phrase ne peut se résumer à la somme des sentiments de ses constituants. La composition du sentiment est la détermination du sentiment d’une unité linguistique à plusieurs mots, telle qu’une expression ou une phrase, est fonction de ses constituants (in Cambria et al., 2017, p.70).

L’analyse de sentiment consiste donc en une appréciation de la subjectivité qui, dans le cadre d’une approche par lexique ou d’une approche supervisée, comporte, elle aussi, une part de subjectivité.

Challenges des contenus publiés sur Twitter

Les contenus générés par les utilisateurs sur Twitter s’inscrivent dans le cadre d’interactions sociales. Sur le plan de la qualité, ils présentent différents niveaux de difficultés à résoudre en amont de l’analyse de sentiment :

1) le texte n’est généralement pas bien formé en termes de grammaire, de structure et de formalité du langage naturel ;

2) il n’y a pas d’harmonisation orthographique et certains termes peuvent donc présenter plusieurs orthographes différentes ;

3) l’usage courant d’abréviations ne répond pas toujours à une logique de standardisation ;

4) les mots argotiques ou jargonnant ne sont pas nécessairement inclus dans les lexiques destinés à l’analyse de sentiment ;

4) des termes non liés au domaine d’application ajoutent du ‘bruit’ aux contenus ;

5) le contexte n’est pas toujours bien défini ;

6) les tweets peuvent contenir des arobases, des noms d’utilisateurs, des émoticons, des hashtags, des hyperliens mais aussi du contenu non textuel. De plus, plusieurs opinions peuvent se côtoyer dans un seul et même tweet (Deng et al., 2017 ; Jain, 2021 ; Kumar et Sebastian, 2012 ; Cambria et al., 2017, p.142 ; Martínez-Cámara et al., 2014).

Tenir compte de ces considérations suppose un traitement des données préalable, lequel est d’autant plus important qu’il a été démontré que l’amélioration de la qualité des données donne lieu à une meilleure qualité de classification des sentiments (Li et al., 2020).

 


Références

Augustyniak, Ł., Szymański, P., Kajdanowicz, T., & Tuligłowicz, W. (2015). Comprehensive study on lexicon-based ensemble classification sentiment analysis. Entropy (Basel, Switzerland), 18(1), 4. https://doi.org/10.3390/e18010004

Bagheri, A., Saraee, M., & de Jong, F. (2013). Care more about customers: Unsupervised domain-independent aspect detection for sentiment analysis of customer reviews. Knowledge-Based Systems, 52, 201–213. https://doi.org/10.1016/j.knosys.2013.08.011

Bogdan, M., & Borza, A. (2020). Big Data Analytics And Firm Performance: A Text Mining Approach. In Proceedings of the INTERNATIONAL MANAGEMENT CONFERENCE (Vol. 14, No. 1, pp. 549-560). Faculty of Management, Academy of Economic Studies, Bucharest, Romania.

Bonta, V., Kumaresh, N., & Janardhan, N. (2019). A comprehensive study on lexicon based approaches for sentiment analysis. Asian Journal of Computer Science and Technology, 8(S2), 1–6. https://doi.org/10.51983/ajcst-2019.8.s2.2037

Cambria, E., Das, D., Bandyopadhyay, S., & Feraco, A. (Eds.). (2017). A practical guide to sentiment analysis (1st ed.). Springer International Publishing.

Chauhan, P., Sharma, N., & Sikka, G. (2021). The emergence of social media data and sentiment analysis in election prediction. Journal of Ambient Intelligence and Humanized Computing, 12(2), 2601–2627. https://doi.org/10.1007/s12652-020-02423-y

Dang, N. C., Moreno-García, M. N., & De la Prieta, F. (2020). Sentiment analysis based on deep learning: A comparative study. In arXiv [cs.CL]. http://arxiv.org/abs/2006.03541

Deng, S., Sinha, A. P., & Zhao, H. (2017). Adapting sentiment lexicons to domain-specific social media texts. Decision Support Systems, 94, 65–76. https://doi.org/10.1016/j.dss.2016.11.001

El Barachi, M., AlKhatib, M., Mathew, S., & Oroumchian, F. (2021). A novel sentiment analysis framework for monitoring the evolving public opinion in real-time: Case study on climate change. Journal of Cleaner Production, 312(127820), 127820. https://doi.org/10.1016/j.jclepro.2021.127820

Glynn, C. J., & Huge, M. E. (2008). Public Opinion. In The International Encyclopedia of Communication. John Wiley & Sons, Ltd.

Grimmer, J., & Stewart, B. M. (2013). Text as data: The promise and pitfalls of automatic content analysis methods for political texts. Political Analysis: An Annual Publication of the Methodology Section of the American Political Science Association, 21(3), 267–297. https://doi.org/10.1093/pan/mps028

Hardeniya, T., & Borikar, D. A. (2016). Dictionary based approach to sentiment analysis-a review. International Journal of Advanced Engineering, 2(5).

Jain, S. (2021). A systematic study on sentiment analysis based on text mining and Deep learning for predictions in Stock Market trends through social and news media data. International Journal for Research in Applied Science and Engineering Technology, 9(10), 1589–1593. https://doi.org/10.22214/ijraset.2021.38662

Keshavarz, H., & Abadeh, M. S. (2017). ALGA: Adaptive lexicon learning using genetic algorithm for sentiment analysis of microblogs. Knowledge-Based Systems, 122, 1–16. https://doi.org/10.1016/j.knosys.2017.01.028

Khoo, C. S. G., & Johnkhan, S. B. (2018). Lexicon-based sentiment analysis: Comparative evaluation of six sentiment lexicons. Journal of Information Science, 44(4), 491–511. https://doi.org/10.1177/0165551517703514

Kumar, A., & Sebastian, T. M. (2012). Sentiment analysis on Twitter. International Journal of Computer Science Issues (IJCSI), 9(4), 372.

Kuznetsov, I., & Gurevych, I. (2018). From text to lexicon: Bridging the gap between word embeddings and lexical resources. In Proceedings of the 27th International Conference on Computational Linguistics (pp. 233–244).

Li, L., Goh, T.-T., & Jin, D. (2020). How textual quality of online reviews affect classification performance: a case of deep learning sentiment analysis. Neural Computing & Applications, 32(9), 4387–4415. https://doi.org/10.1007/s00521-018-3865-7

Liu, B. (2012). Sentiment Analysis and Opinion Mining. Morgan & Claypool.

Martínez-Cámara, E., Martín-Valdivia, M. T., Ureña-López, L. A., & Montejo-Ráez, A. R. (2014). Sentiment analysis in Twitter. Natural Language Engineering, 20(1), 1–28. https://doi.org/10.1017/s1351324912000332

Medhat, W., Hassan, A., & Korashy, H. (2014). Sentiment analysis algorithms and applications: A survey. Ain Shams Engineering Journal, 5(4), 1093–1113. https://doi.org/10.1016/j.asej.2014.04.011

Mejova, Y. (2009). Sentiment analysis: An overview. University of Iowa, Computer Science Department

Mowlaei, M. E., Saniee Abadeh, M., & Keshavarz, H. (2020). Aspect-based sentiment analysis using adaptive aspect-based lexicons. Expert Systems with Applications, 148(113234), 113234. https://doi.org/10.1016/j.eswa.2020.113234

Parvin, S. A., Sumathi, M., & Mohan, C. (2021). Challenges of sentiment analysis – A survey. 2021 5th International Conference on Trends in Electronics and Informatics (ICOEI).

Prabowo, R., & Thelwall, M. (2009). Sentiment analysis: A combined approach. Journal of Informetrics, 3(2), 143–157. https://doi.org/10.1016/j.joi.2009.01.003

Rice, D. R., & Zorn, C. (2021). Corpus-based dictionaries for sentiment analysis of specialized vocabularies. Political Science Research and Methods, 9(1), 20–35. https://doi.org/10.1017/psrm.2019.10

Turner, Z., Computer Science and Computer Engineering, University of Arkansas, Fayetteville, Arkansas, United States, Labille, K., Gauch, S., Computer Science and Computer Engineering, University of Arkansas, Fayetteville, Arkansas, United States, & Computer Science and Computer Engineering, University of Arkansas, Fayetteville, Arkansas, United States. (2021). Lexicon-based sentiment analysis for stock movement prediction. Journal of Construction Materials, 2(3). https://doi.org/10.36756/jcm.v2.3.5

van Atteveldt, W., van der Velden, M. A. C. G., & Boukes, M. (2021). The validity of sentiment analysis: Comparing manual annotation, crowd-coding, dictionary approaches, and machine learning algorithms. Communication Methods and Measures, 15(2), 121–140. https://doi.org/10.1080/19312458.2020.1869198

Zhang, L., Wang, S., & Liu, B. (2018). Deep learning for sentiment analysis: A survey. Wiley Interdisciplinary Reviews. Data Mining and Knowledge Discovery, 8(4), e1253. https://doi.org/10.1002/widm.1253

 

# # #

Lire aussi

Blog 21 : politiques, experts et journalistes

Blog 20 : pour la vaccination, contre les restrictions

Blog 19 : analyse de sentiment comparée

Blog 18 : une crise sanitaire et politique

Blog 17 : anatomie du sous-corpus « mesures politiques/sanitaires » (en)

Blog 16 : analyse de sentiment du sous-corpus ‘vaccination’ (en, part.2)

Blog 15 : analyse de sentiment comparée du sous-corpus ‘vaccination’ (en, part.1)

Blog 14 : un dictionnaire pour l’analyse de sentiment adapté à la crise Covid

Blog 13 : construire une liste de stop words

Blog 12 : principaux dictionnaires pour l’analyse de sentiment

Blog 11 : description statistique du corpus avec #RStats

Blog 10 : l’analyse de sentiment ou l’évaluation de la subjectivité

Blog 9 : modélisation thématique du corpus ‘vaccination’ (en)

Blog 8 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.2)

Blog 7 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.1)

Blog 6 : collecte du corpus et préparation de l’analyse lexicale

Blog 5: le package R « textclean »

Blog 4 : cibler la bonne requête et nettoyer des messy data

Blog 3 : Twitter API et rtweet

Blog 2 : collecte du corpus

Blog 1: le projet

Les enjeux de la recherche sur les usages médiatiques en temps de crise