Diversité et concentration de l’information sur le web

« Diversité et concentration de l’information sur le web » : analyser le web français

Résumé détaillé et mise en perspective de Diversité et concentration de l’information sur le web – Une analyse à grande échelle des sites d’actualité français publié dans la revue Réseaux en 2012. Travail réalisé dans le cadre du cours d’information-communication Cultures et médias numériques de Sophie Noël dans le master Médias, langages et sociétés à l’Université Paris Panthéon-Assas.

Dans un épisode dédié à Cyril Hanouna diffusé ce 30 novembre, Complément d’enquête montrait une infographie montrant que « le nombre d’articles évoquant les sanctions de l’Arcom à l’encontre de C8 a dégringolé peu de temps après le rachat de Prisma Media par Vivendi », qui possède également le groupe Canal+, propriétaire de C8. C’est d’autant plus le cas dans des médias spécialisés dans la télévision comme TéléLoisirs ou encore Télé 2 semaines.

Diversité et concentration de l’information sur le web

La rédaction explique avoir « indexé les milliers d’articles concernant l’animateur ou ses émissions, en collectant tous les articles de ces sites dans les pages de référencement » en sélectionnant « les médias à la plus forte audience, et spécialisés dans le traitement du monde de la télévision, ou dans l’actualité des peoples ». Ils ont ensuite « automatiquement détecté si l’Arcom était mentionné dans le titre ou le corps du texte ». Finalement, cette infographie de Complément d’enquête reprend la même méthode que celle des chercheurs de « Diversité et concentration de l’information sur le web – Une analyse à grande échelle des sites d’actualité français ». Il a été publié dans la revue Réseaux en 2012 et rédigé à quatre paires de mains.

L’objectif de la recherche de Diversité et concentration de l’information sur le web – Une analyse à grande échelle des sites d’actualité français

Le but des chercheurs était de produire une analyse de dizaines de milliers d’articles issus de 200 sites en France. Ils souhaitaient étudier la variété éditoriale dans l’espace médiatique, mais aussi la distribution des sujets et de leur présence médiatique. Ils se sont demandé quels étaient les sites qui apportent le plus de variété éditoriale et si quantité d’articles signifiait qualité des articles.

Les chercheurs

Emmanuel Marty est maître de conférences en SIC à l’Université Grenoble Alpes ; il est spécialiste d’Internet et des nouveaux médias ainsi qu’expert en analyse du discours et lexicométrie. Franck Rebillard est enseignant-chercheur en SIC à l’Université Sorbonne Nouvelle ; elle est spécialiste en socio-économie des médias et de l’Internet et experte en méthodes d’analyse de l’information en ligne. Stéphanie Pouchot est ancienne maîtresse de conférences en SIC à l’Université Claude Bernard ; elle est spécialiste de la documentation et informations scientifiques et techniques. Thierry Lafouge est enseignant-chercheur en SIC à l’Université Claude Bernard ; il est spécialiste de l’infométrie, de la bibliométrie et de la scientométrie.

Tous ces chercheurs, s’ils sont tous issus des sciences de l’information et de la communication, ont des spécialités différentes. Pour autant, elles se complètent très bien dans le cadre de la recherche, avec certains ayant des compétences plutôt techniques, tandis que d’autres ont des compétences en analyse du discours.

Une recherche vieillissante

Malheureusement, les résultats ont été présentés en 2012 (avec une analyse réalisée en 2011), soit il y a 11 ans. On peut naturellement supposer que depuis, le web français a énormément changé. Tout d’abord, à cette époque les réseaux sociaux étaient moins puissants qu’aujourd’hui : Twitter émergeait, Facebook connaissait un succès grandissant et surtout les médias y étaient moins présents qu’aujourd’hui. De plus, l’article prend énormément en compte les blogs, qui ont un succès bien moindre aujourd’hui : ces créateurs sont désormais davantage sur les réseaux sociaux. C’est ce dont on pouvait déjà se rendre compte en 2015 dans les travaux de Sidonie Naulin sur la blogosphère culinaire.

Ce qu’offre Internet médiatiquement

Internet est un « lieu potentiel de pluralisme de l’information », puisque des amateurs peuvent écrire des articles au même titre que des journalistes. Ils peuvent même les influencer dans la sélection de l’information. Ce qui renforce cette idée, c’est « l’interactivité supposée » du web qui peut être entendue « comme un facteur contribuant à mettre le débat démocratique et l’expression politique au premier plan de l’information médiatique ».

Mais comme partout, il y a sur le web « une compétition pour l’accès à une tribune numérique ». Il y a une « circulation circulaire de l’information » d’autant plus grande et complexe sur Internet avec ce qu’on appelle les infomédiaires. Un infomédiaire, c’est un acteur d’Internet qui organise les informations pour les internautes en les sélectionnant. Ce sont des « portails d’information » : on parle ici de MSN (le portail, pas le service de messagerie), Yahoo Actualités, et surtout Google Actualités.

À lire également : En quoi la notion de « discours d’escorte » des technologies est pertinente pour analyser les médias d’aujourd’hui ?

Concernant les infomédiaires, les médias sont partagés entre la « mise en cause d’une concurrence considérée comme déloyale et souci presque obsessionnel d’un bon référencement ». Évidemment, cela pèse sur les contenus éditoriaux. Le plus puissant, c’est Google Actualités : tous les jours les médias se mènent une bataille pour entrer dans un « cluster ». Lorsque le portail détecte un nouveau sujet d’actualité, il crée une sous-catégorie dédiée en sélectionnant certains articles. Il est alors très important pour un journal d’y entrer, surtout lorsque celui-ci est important. Par exemple, la compétition est extrêmement forte lors de périodes de promotion : durant le Black Friday, les médias tentent de se positionner le mieux possible pour attirer les lecteurs et générer de l’argent grâce à l’affiliation avec les sites d’e-commerce, lorsqu’ils mettent en avant des produits en réduction.

À lire également : Comment le développement de la technique peut-il entraîner des dérives ?

La méthode d’analyse de Diversité et concentration de l’information sur le web – Une analyse à grande échelle des sites d’actualité français

Le traitement des articles s’est déroulé en environ cinq étapes. La première a été l’analyse de l’agenda médiatique, avec une méthodologie adaptée à la configuration du web : cela sous-entend la sélection des sujets au regard de la newsworthiness, ou la valeur d’une actualité, son intérêt. Les chercheurs ont par la suite catégorisé tous les sites qu’ils souhaitaient étudier, en retenant quatre types de médias : les médias en ligne (43), les sites natifs de l’Internet (40), les blogs (102) ainsi que les infomédiaires (14). Pour le recensement des sites, ils ont créé une liste alimentée par du crawling ainsi que via le partage de liens. Quant à la collecte des articles, elle a semblé assez simple : les articles ont été récupérés via les flux RSS des sites sur lesquels ils étaient publiés. Néanmoins, tous les articles publiés par les 199 sites analysées n’ont pas été sélectionnés : n’ont été retenus que les articles d’information général et politique, avec un caractère national. Enfin, il a fallu classifier les articles en sujets d’actualité via une analyse de discours et une reconstitution de l’agenda médiatique, en partie grâce à la méthode du codage.

Au total, ce sont 199 sites qui ont été analysés et qui ont publié sur deux semaines 37 569 articles. Ces derniers ont été répartis en 700 sujets d’actualité différents.

Concernant la classification des articles en sujets d’actualité

Pour les chercheurs, l’agenda médiatique est « une sorte de mosaïque composée de différents sujets d’actualité abordés par l’ensemble des sites ». Ces sujets sont « de plus ou moins grande importance, en fonction du volume d’articles qui leur sont consacrés ou du nombre de sites qui leur prêtent attention ». Un sujet d’actualité peut avoir deux types de cadrage :

  • Le cadrage primaire : le concept de « fait », « l’activité de perception d’une expérience par les sens », que les journalistes sélectionnent et traitent différemment selon les médias ;
  • Le cadrage secondaire : le traitement médiatique d’un même fait, avec différents angles, lignes éditoriales, points de vue.

Par exemple, dans la presse tech, l’annonce du dernier iPhone, c’est un cadrage primaire. Mais les articles qui vont le comparer au précédent, qui vont avoir un angle sur une nouveauté ou qui vont prodiguer des conseils d’achat en rapport avec ce produit sont du ressort du cadrage secondaire.

La physionomie de l’agenda médiatique sur le web

Ce dont on se rend compte, c’est que le nombre de publications est stable chaque jour, sauf le week-end, puisqu’il y a moins de personnel. Quant à la couverture médiatique, ce dont on se rend compte, c’est qu’un « nombre réduit de sujets concentre la majorité des articles et, inversement, de très nombreux sujets sont abordés de façon isolée dans un seul article ou une poignée d’articles ».

diversité et concentration de l'information sur le web
diversité et concentration de l'information sur le web

En fait, on trouve ici la loi de Pareto : « 20% des sujets rassemblent à eux seuls environ 80% des articles » et inversement. Pour les quatre auteurs c’est sûr, il y a un « déséquilibre quotidien de l’agenda médiatique en ligne, entre surexposition d’une minorité de sujets d’actualité et confidentialité de la majorité d’entre eux ».

diversité et concentration de l'information sur le web

La contribution des différents sites au pluralisme

Les sites qui abordent le plus grand nombre de sujets, ce sont naturellement les infomédiaires, mais aussi « plusieurs sites natifs de l’internet présentant une forme participative d’ouverture aux contributions d’amateurs ». Ceux qui abordent le moins de sujets, ce sont surtout les blogs, puisqu’ils produisent moins d’articles.

Mais ce pluralisme interne doit aussi se mesurer par le rapport entre nombre d’articles produits et nombre de sujets abordés. Un pluralisme interne favorisé par les sites qui produisent un article par sujet. Là, ce sont les blogs qui caracolent en tête, notamment le BondyBlog, qui a un modèle éditorial particulier. C’est là aussi que les infomédiaires sont les moins bons, puisqu’ils multiplient les articles sur un même sujet.

C’est pourquoi il faut aussi « déterminer si chacun des sites s’attache à des sujets très prisés, ou au contraire peu relayés par d’autres ». Ce dont on se rend compte, c’est que « les sites qui valorisent l’éclectisme éditorial sont aussi ceux qui ont la plus grande originalité éditoriale ». Ce sont surtout les blogs et les sites natifs de l’internet, notamment ceux qui ont « des positions idéologiques très radicales voire extrêmes » ou ceux qui se vendent en tant qu’alternatives aux médias existants. D’ailleurs, les sites natifs et les blogs privilégient les sujets rares.

Une représentation cartographique de l’information sur le web

Les chercheurs ont réalisé « une représentation cartographique qui à la fois rend compte de la physionomie particulière de l’agenda médiatique sur le web et situe le rôle de chaque site, dans leurs relations au sein de cet ensemble complexe ». Sur cette cartographie, on peut appréhender la production d’information dans sa totalité avec la répartition entre les différents sujets d’actualité. Elle s’appuie sur les sites analysés et indique leur propension « à s’attacher à des sujets rares ou au contraire quasi incontournables ».

Cette cartographie a été réalisée à l’aide d’un algorithme qui calcule la similarité des sites « par le biais de la similarité de leur production éditoriale. Il aboutit à rapprocher les sites qui partagent des sujets d’actualité communs, en procédant à des regroupements différenciés selon que ces sujets communs sont des sujets plutôt dominants ou plutôt rares au sein du corpus total d’articles. »

Ainsi :

  • On trouve au centre « les sites qui partagent les sujets les plus traités et en périphérie les sites qui partagent des sujets beaucoup plus isolés » ;
  • Les nœuds « correspondent chacun à des sites d’actualité, et la taille de chaque nœud est relative au nombre d’articles produits » ;
  • Les liens entre les nœuds « représentent les proximités thématiques, reliant des sites lorsqu’ils abordent des sujets communs ».

Les chercheurs ont alors désigné trois zones :

  • Zone 1 : le mainstream médiatique, avec les sites les plus productifs partageant un nombre considérable de sujets d’actualité à l’agenda médiatique ;
  • Zone 2 : un « espace éditorial intermédiaire, où des sites d’envergure très inégale restent branchés sur l’actualité dominante tout en étant également attentifs à des sujets plus iconoclastes » ;
  • Zone 3 : « l’information alternative, faite de sujets d’actualité beaucoup moins repris, par des sites eux-mêmes plus restrictifs dans leur production ».

Que retenir de Diversité et concentration de l’information sur le web – Une analyse à grande échelle des sites d’actualité français ?

Ce qu’Emmanuel Marty, Franck Rebillard, Stéphanie Pouchot et Thierry Lafouge retiennent, c’est qu’il y a une grande variété éditoriale sur Internet, « avec plusieurs centaines de sujets abordés chaque jour ». Pour autant, l’agenda médiatique n’est pas équilibré, avec une « dichotomie permanente entre l’ultra-médiatisation de certains sujets, retraités à l’envie, et la dissémination de sujets peinant à trouver une visibilité en dehors de leurs sources d’origine ». Il y a d’ailleurs une « ligne de fracture » avec d’un côté les sites productifs comme les infomédiaires et les médias en ligne les plus productifs, puisque les premiers reprennent les informations des autres. De l’autre côté, il y a des sites natifs de l’Internet et des blogs qui « créent eux des foyers d’originalité éditoriale ». En fait, plus on multiplie les espaces de publication sur le web, plus on multiplie les relations éditoriales et leur complexité.

Les chercheurs le reconnaissent, cette étude ne prend pas du tout en compte l’aspect qualitatif de l’analyse éditoriale du web français. En effet, les sites ne traitent pas nécessairement de la même manière un même sujet d’actualité. Il y a là une « diversité offerte » analysée et non une « diversité consommée ». C’est pourquoi il faudrait étudier le « contexte social de réception ».

Le danger de la concentration des médias l’est aussi sur le web

Ce qui met en danger la variété éditoriale du web français, c’est la concentration des médias. Elle ne se limite pas qu’à la radio, à la télévision ou aux journaux. De la concentration, il y en a aussi sur Internet, et elle s’accélère même sur ce support. C’est le cas notamment dans des niches spécialisées, comme celui des nouvelles technologies. On compte des grands groupes comme Webedia, Reworld Media, Vivendi, etc. qui rachètent à tour de bras des médias et qui participent à une précarisation du métier de journaliste. Le risque, c’est d’avoir une information tronquée et cela continue d’arriver.

C’est d’ailleurs ce qu’a montré l’infographie des journalistes de France 2 concernant le traitement médiatique des sanctions de l’Arcom à l’encontre des émissions de Cyril Hanouna. Ces médias, appartenant au même groupe, se mettent à moins traiter ce qui pourrait déranger Vivendi. C’est une situation supplémentaire de l’interventionnisme d’un acteur industriel dans le travail des journalistes. Et c’est ce qui inquiète de plus en plus ces derniers, ce qui a amené l’association Fonds pour une presse libre à organiser les « États généraux de la presse indépendante » et à rédiger 59 propositions de lois, pour renforcer, mais surtout actualiser la législation en matière de concentration des médias en novembre 2023.

Bibliographie

« Stéphanie Pouchot | LinkedIn ». Consulté le 12 décembre 2023. https://www.linkedin.com/in/st%C3%A9phanie-pouchot-53b0b43/.

Arabian, Andrew Kemp, Vahe. « Guide de référencement Google Actualités 2024 ». State of Digital Publishing, 20 octobre 2023. https://www.stateofdigitalpublishing.com/fr/referencement/google-nouvelles-seo/.

Bernard, Hugo. « Content commerce : une nouvelle source de revenus pour les médias en ligne ? » Hugo Bernard (blog), 30 avril 2022. https://hugobernard.fr/content-commerce-nouvelle-source-de-revenus-medias-en-ligne/.

———. « La concentration de la presse tech française et l’instabilité de l’indépendance ». Rotek (blog), 15 septembre 2022. https://rotek.fr/concentration-presse-tech-francaise-instabilite-independance/.

———. « Pourquoi le Black Friday est une opportunité importante pour les médias en ligne ». Hugo Bernard (blog), 30 novembre 2021. https://hugobernard.fr/pourquoi-black-friday-opportunite-importante-medias-en-ligne/.

Complément d’enquête Cyril Hanouna : le nouveau parrain du PAF, 2023. https://www.france.tv/france-2/complement-d-enquete/5425590-cyril-hanouna-le-nouveau-parrain-du-paf.html.

Elico, équipe de recherche de Lyon en sciences de l’information et de la communication. « Thierry LAFOUGE ». Consulté le 12 décembre 2023. https://elico-recherche.msh-lse.fr/membres/thierry-lafouge.

Fonds pour une presse libre. « Les Etats généraux de la presse indépendante : revoir notre grande soirée! » Consulté le 12 décembre 2023. https://fondspresselibre.org/les-etats-generaux-de-la-presse-independante-cest-ce-soir.

Fonds pour une presse libre. « Téléchargez le livret de nos 59 propositions pour libérer l’info ». Consulté le 12 décembre 2023. https://fondspresselibre.org/telechargez-nos-59-propositions-pour-liberer-linfo.

Guibert, Gérôme, Franck Rebillard, et Fabrice Rochelandet. « Chapitre 3. Infomédiation et plateformes numériques ». In Médias, culture et numérique, 81‑117. Cursus. Paris: Armand Colin, 2016. https://www.cairn.info/medias-culture-et-numerique–9782200614546-p-81.htm.

« INFOGRAPHIE. Comment les sanctions de l’Arcom contre C8 et Cyril Hanouna se sont évaporées des sites de “Télé-Loisirs”, “Voici” ou “Gala” après leur rachat par Vincent Bolloré ». Consulté le 12 décembre 2023. https://www.francetvinfo.fr/culture/tv/cyril-hanouna/infographie-comment-les-sanctions-de-l-arcom-contre-c8-et-cyril-hanouna-se-sont-evaporees-des-sites-de-tele-loisirs-voici-ou-gala-apres-leur-rachat-par-vincent-bollore_6209427.html.

Marty, Emmanuel. « EMMANUEL MARTY ». Université Grenoble Alpes. Emmanuel Marty. Consulté le 12 décembre 2023. https://www.univ-grenoble-alpes.fr/emmanuel-marty-539633.kjsp?RH=UAINTERFR_ANN.

Marty, Emmanuel, Franck Rebillard, Stéphanie Pouchot, et Thierry Lafouge. « Diversité et concentration de l’information sur le web. Une analyse à grande échelle des sites d’actualité français ». Réseaux 176, no 6 (2012): 27‑72. https://doi.org/10.3917/res.176.0027.

Rebillard, Franck. « Université Sorbonne Nouvelle – Paris 3 – M. REBILLARD Franck ». Franck Rebillard. Consulté le 12 décembre 2023. http://www.univ-paris3.fr/m-rebillard-franck-81572.kjsp.

Sénat. « Commission d’enquête «Concentration des médias en France» », 6 avril 2022. https://www.senat.fr/travaux-parlementaires/structures-temporaires/commissions-denquete/commissions-denquete/commission-denquete-concentration-des-medias-en-france.html.

Seuil, Editions. « L’Information Est Un Bien Public , Juli… » Consulté le 12 décembre 2023. https://www.seuil.com/ouvrage/l-information-est-un-bien-public-julia-cage/9782021483154.

« Vivendi ». In Wikipédia, 7 novembre 2023. https://fr.wikipedia.org/w/index.php?title=Vivendi&oldid=209419482.


Publié

dans

, ,

Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *