La grande majorité des sites d'information en ligne offrent désormais la possibilité aux internautes de réagir à l'actualité par le biais de commentaires en marge des articles. Or, si la littérature académique concernant les contenus produits par les utilisateurs sur le web est relativement importante aujourd'hui, dans la diversité des genres discursifs en ligne (blogs, forums, réseaux sociaux...), le commentaire, et plus encore le « commentaire à chaud de l'actualité » (Dupret & al., 2010) reste peu étudié. Plus précisément, les travaux qui l'abordent mettent l'accent sur des dimensions pragmatiques (son intrication avec les modèles économiques de la presse en ligne, ses incidences sur l'activité journalistique dans le cas du journalisme participatif, la nouvelle relation entre journaliste et consommateur-producteur, etc. (Dagiral & Parisie, 2010)) ou formelles (approches ethnographiques de ce genre discursif somme toute récent (Barats, 2013)) mais rares sont ceux qui s'intéressent au contenu propre de ces discours tels qu'ils sont suscités par les dispositifs interactifs des médias en ligne.
Dans un premier temps, nous dresserons donc dans cette communication un bilan des raisons qui peuvent rendre complexe voire repoussante l'approche des corpus de commentaires. Dans un second temps, nous chercherons à dépasser ces contraintes en montrant qu'un cadre conceptuel alliant SIC et analyse du discours permet de poser une réflexion tant théorique que méthodologique à même de légitimer l'approche de leurs contenus. Nous présenterons par ailleurs une étude de cas à l'appui de nos conclusions : l'analyse des réactions d'internautes autour de l'accident nucléaire de Fukushima révèle, par-delà une cacophonie de surface, à la fois une richesse des modes d'interprétation de l'événement et une structuration de celle-ci autour d'un nombre restreint de pôles attracteurs. De tels résultats plaident ainsi pour un intérêt sociopolitique de l'analyse qualitative des tableaux de commentaires.
I. Cadre théorique : de l'intérêt d'analyser les comment boards.
Si d'un coté les corpus de commentaires peuvent apparaître obscurs pour différentes raisons (que la littérature SIC met régulièrement et plus ou moins incidemment en avant : données sociodémographiques des utilisateurs souvent inconnues voire inconnaissables, genre discursif hétérogène (Dupret et al, 2010), contenu volontiers violent, vulgaire et/ou raciste (Hughey & Daniels, 2013), méta-énonciation de la modération et dispositifs différents et influents (Boure, 2013)...), un ensemble de travaux s'accordent à souligner leur dimension politique et expressive ainsi que l'intérêt qu'y accordent les lecteurs de la presse en ligne (Barnes, 2013). Le contenu des commentaires d'actualité présente ainsi la plupart du temps, au moins en filigrane, l'expression émotionnelle d'une opinion à dimension idéologique qui a vocation à circuler dans l'espace public par simple lecture mais également par influence, reprise ou répétition. Ces textes sont ainsi analysables en tant qu'ils constituent une part de ce que Marc Angenot (2006) appelle le discours social, c'est à dire une part de l'économie générale du flot des idées en suspension, à un moment donné, dans un état de société donné.
Par ailleurs, la théorie du discours social établit qu'au-delà de l'hétérogénéité apparente de toutes les productions discursives d'une époque, se dégagent certaines constances qui se regroupent sous des tendances hégémoniques. L'hégémonie n'est pas entendue ici comme ce qui se dit le plus souvent ou le plus fort mais retient autant les discours des groupes dominants que les contre-doxas subversives de milieux moins audibles. Elle s'oppose en cela non pas au contre-dit mais au pas-encore-dit. Derrière le tohu-bohu apparent et l'intuition naïve que tout peut se dire et, mieux encore, que tout se dit toujours quelque part, il est en fait possible de délimiter dans les modes de dire le monde et donc de le connaître, dans la « construction psycho-socio-langagière de sens » (Charaudeau, 1995), des dominances et des récurrences (Delforce & Noyer, 1999:25). Les masses de commentaires, issues de sites variés, ne présentent donc pas une diversité incompressible mais donnent au contraire à voir des sédimentations autour de pôles attracteurs que l'analyse permet de cartographier.
II. Étude de cas.
Notre étude de cas porte sur un corpus de commentaires en réaction aux incidents nucléaires survenus à Fukushima, à la suite du tsunami qui balaya les côtes japonaises le 11 mars 2011. Nous analysons les discours produits par les internautes-commentateurs sur quatre des sites de presse en ligne les plus visités, Le Monde.fr, 20minutes.fr, L'Express.fr et Rue89.fr dans les 3 jours suivant l'annonce de l'endommagemment de la centrale de Fukushima-Daiichi.
Nos résultats reposent sur une méthodologie d'analyse argumentative du discours (Amossy, 2008). Nous considérons ainsi que tout discours propose, et tend à faire partager, une vision du monde particulière. L'analyse se donne alors pour but de mettre au jour, à travers l'étude des raisonnements et des liens logico-argumentatifs tissés par tel ou tel cadrage, telle ou telle mise en mots, les systèmes de valeurs et les formes de cognition construits dans et par les textes. Par ailleurs, nous outillons notre analyse du logiciel de lexicométrie Lexico3 (André Salem, SYLED, Paris III). Conformément aux précautions règlant l'usage de la lexicométrie dans une perspective textuelle et non seulement lexicale (Rastier, 2008) l'outil trouve sa place dans une dialectique permanente entre regards micro- et macro-, tantôt confirmant ou infirmant des hypothèses issues de la lecture fine, tantôt en proposant à la vérification de celle-ci.
III. Conclusions et perspectives.
Nous entendons ainsi défendre trois conclusions :
1) Les tableaux de commentaires d'actualité ne sont pas les masses ineptes qu'ils peuvent paraître : ils sont au contraire porteurs de contenus idéologiques qui renseignent sur les formes d'appréhension du monde qui peuvent circuler dans l'espace public.
2) Si la fouille d'opinion (Opinion Mining) par définition quantitative est un domaine en plein essor (Ensoo & al., 2013), une approche qualitative, ou au moins mixte, présente des intérêts non-négligeables en termes de précision et de diversité des données extraites tout en permettant, dans le cadre théorique du discours social, de traiter à moindres frais des corpus de texte de grande taille.
3) Enfin, les résultats de ce type d'étude peuvent rejoindre les questionnements actuels sur l'engagement du chercheur et l'ouverture des travaux académiques sur les débats de société. Le numérique pose entre autres la question de la gestion du multiple : le tri, l'archivage, la ré-utilisation des grandes masses de données productibles ou accessibles demande des compétences ou des pratiques spécifiques. Il en va des milliers de photos qu'un utilisateur unique peut posséder sur ses disques durs comme de ses centaines d'amis sur Facebook ; et comme des idées nombreuses, contradictoires et complexes dont internet peut abreuver l'individu et la société. Car si le déjà traditionnel débat dans les internet studies entre tenants de la balkanisation des idées et croyances en un web-agora idéal ou circulerait librement toute la diversité des opinions ne sera sans doute jamais tranché (Flichy, 2008), la plupart des travaux quantitatifs à grande echelle s'accordent à dire que sinon écouter, au moins « rencontrer la différence » est chose aisée et fréquente sur la toile (Brundidge, 2010).
Aussi, outre l'intérêt anthroposocial d'établir un cliché du discours social, cartographier les valeurs et les argumentations en confrontation, dont le tumulte est renforcé par les nouveaux outils du numérique, peut permettre de fournir un matériau original pour nourrir ou simplement éclairer les débats publics.
Références :Amossy, R., Argumentation et Analyse du discours : perspectives théoriques et découpages disciplinaires, Argumentation et Analyse du Discours, n°1, 2008.
Angenot, M., Théorie du discours social, ConTEXTES, n°1, 2006.
Barats, C (dir.), Manuel d'analyse du web en sciences humaines et sociales, Armand Colin, Paris, 2013.
Barnes, R., Understanding the affective investment produced through commenting on Australian alternative journalism website New Matilda, New Media and Society, 2013.
Boure, R., Parler rugby en ligne entre soi, Réseaux, n° 180, 2013, p.157-187.
Brundidge, J., Encountering ‘‘Difference'' in the Contemporary Public Sphere: The Contribution of the Internet to the Heterogeneity of Political Discussion, Networks Journal of Communication, n°60, 2010, p.680–700.
Charaudeau, P., Une analyse sémiolinguistique du discours, Langages, n° 117, 1995, p.96-111.
Dagiral, É., Parasie, S., Presse en ligne : où en est la recherche ?, Réseaux, n° 160-161, 2010, p.13-42.
Delforce, B., Noyer, J., Pour une approche interdisciplinaire des phénomènes de médiatisation : constructivisme et discursivité sociale, Études de communication, n°22, 1999, p.13-40.
Dupret, B., et al., Commenter l'actualité sur internet, Réseaux, n° 160-161, 2010, p.285-317.
Eensoo-Ramdani, E. et al., De la fouille de données à la fabrique de l'opinion, Les Cahiers du numérique, n°2, 2011, p.15-40.
Flichy, P., Internet et le débat démocratique, Réseaux, n°150, 2008, p.159-185.
Hughey, M. W., Daniels, J., Racist comments at online news sites: a methodological dilemma for discourse analysis, Media, Culture & Society, n°35, 2013, p.332-347.
Rastier, F., La Mesure et le Grain. Sémantique de corpus, Paris, Editions H. Champion, 2011