Mes premiers pas sur Mastondon ont généré des échanges et des découvertes comme je n’en avais pas rencontrés depuis longtemps. Grace à Yannick Rochat, j’y dois la découverte de l’article Challenges in the Decentralised Web: The Mastodon Case publié en 2019 de Aravindh Raman, Sagar Joglekar, Emiliano De Cristofaro, Nishanth Sastry et Gareth Tyson. En 2019, il s’agissait de la recherche la plus importante relativement à Mastodon. Je vous propose une synthèse de cet important article et quelques-uns de ses passages traduits en français concernant le retour à un Web décentralisé.

Le partage original de l’article par Yannick Rochat:
L’introduction de l’article pose, à mon avis fort bien, le cadre de la réflexion et de la discussion plus large que Mastodon, mais qui y est abordée par ce prisme :
*Le Web décentralisé (DW) a récemment connu un nouvel élan, avec un certain nombre de plateformes DW comme *Mastodon*, *PeerTube* et Hubzilla qui gagnent en popularité. Celles-ci offrent des alternatives aux réseaux sociaux traditionnels comme Twitter, YouTube et Facebook, en permettant l’exploitation d’infrastructures et de services Web sans propriété ni contrôle centralisés. Bien que leurs services diffèrent grandement, les plateformes DW modernes reposent principalement sur deux innovations clés : premièrement, leur logiciel libre permet à quiconque de mettre en place des serveurs indépendants (« instances ») auxquels les gens peuvent s’inscrire et qu’ils peuvent utiliser au sein d’une communauté locale ; et deuxièmement, elles s’appuient sur des protocoles de fédération afin que les instances puissent s’interconnecter, en mode pair-à-pair (peer-to-peer), pour offrir un réseau intégré à l’échelle mondiale.*
Le première spécificité de ce Web décentralisé par rapport tant aux réseaux usuels qu’aux anciennes instances du monde du logiciel libre réside dans le fait que des instances indépendantes, faciles à démarrer et à gérer pour des personnes généralement bénévoles, interagissent avec d’autres instances décentralisées recourant au même protocole.
Premièrement, ils décomposent leurs offres de services en serveurs indépendants (« instances ») que tout le monde peut facilement démarrer. Dans le cas le plus simple, ces instances permettent aux utilisateurs de s’inscrire et d’interagir les uns avec les autres localement (par exemple, en partageant des vidéos), mais elles permettent également une interaction inter-instances via la deuxième innovation, c’est-à-dire la fédération. Cela implique de s’appuyer sur des protocoles décentralisés pour permettre aux instances d’interagir et d’agréger leurs utilisateurs afin d’offrir un service intégré à l’échelle mondiale.
C’est cette fédération entre les instances qui est appelée Fediverse.
Tout système ne pouvant pas générer que des avantages, certains défis ou questions se posent néanmoins que les auteurs de l’article observent ensuite à travers le cas de Mastodon. Cette instance était déjà, avant ses derniers jours et le rachat de Twitter par Elon Musk, l’instance la plus utilisée du Fediverse.
Le principal défi est celui des pressions naturelles à la centralisation (s’abonner à l’instance du Fediverse comportant le plus d’abonnés par exemple). Le deuxième défi est probablement la résistance de ces instances aux activités malveillantes à grande échelle (par exemple, les robots spammeurs). Le troisième défi est celui de la protection de l’utilisateur contre la la perte de données pendant les pannes d’instance.
Leur analyse a porté sur 67 millions de toots (messages) durant 15 mois.
Il est à noter qu’en 2019 s’il existait un large éventail d’instances et, avant la migration en cours des utilisateur•trices de twitter, la pression existait déjà en faveur de la centralisation du dispositif, pression exercée par les utilisateurs, les infrastructures et les défaillances (pannes) des instances.
Ces défaillances touchaient tous les types d’instances et la nature volontaire de nombreux opérateurs d’instance, c’est-à-dire que les instances à faible disponibilité, ne jouaient aucun rôle en la matière :
les défaillances se produisent sur des instances dans tout le spectre de la popularité – il y a un certain nombre d’instances qui hébergent plus de 100K toots qui connaissent des pannes.
En résumé, les défaillances d’instances ne sont pas rares et peuvent avoir un impact qui dépasse leur base d’utilisateurs locale en raison de l’interconnexion (fédérée) entre les instances des utilisateurs.
En même temps, certaines instances très influentes fonctionnent comme des « mangeoires » pour le reste du réseau. Plus une instance génère de toots, plus la probabilité qu’ils soient répliqués à d’autres instances est élevée (corrélation 0,97), soulignant ainsi l’importance d’un petit nombre d’instances. Il s’agit donc d’une autre forme inhérente de centralisation.
Paradoxalement (ou pas), cela confirme que la décentralisation des instances est le meilleur garant contre les effets d’une défaillance d’un serveur. En effet, après avoir effectué des simulations à partir des données récoltées, les auteurs notent que par exemple
la suppression des 10 premières instances n’entraîne plus que 2,1 % de toots indisponibles (contre 62,69 % sans réplication).
Voici maintenant les éléments principaux de leur conclusion :
Nous avons constaté que la décision de conception de Mastodon de donner à chacun la possibilité de créer sa propre instance indépendante a conduit à un écosystème actif, avec des instances couvrant une grande variété de sujets. Cependant, un thème commun dans notre travail a été la découverte de formes apparentes de centralisation au sein de Mastodon. Par exemple, 10 % des instances hébergent presque la moitié des utilisateurs, et certaines catégories présentent une dépendance remarquable à un petit ensemble d’instances. Cela s’étend aux pratiques d’hébergement, avec trois AS hébergeant près de deux tiers des utilisateurs.
Nos simulations ont également confirmé que ces pressions naturelles vers la centralisation entraînent des points de défaillance potentiels. […] des pannes dans seulement 10 instances peuvent supprimer presque la moitié de tous les toots. […] À la recherche de mesures d’atténuation possibles, nous avons expérimenté des stratégies de réplication simples pour constater que la disponibilité peut être considérablement améliorée en copiant les toots sur des instances secondaires, c’est-à-dire en réduisant le niveau de centralisation. […]
Nous soutenons que si ces problèmes sont ignorés, le DW risque de converger vers un système semi-centralisé.
A mon avis, ce risque de semi-centralisation existe d’autant plus avec la migration actuelle. La politique adoptée par certaines instances de ne plus accepter de nouveaux comptes au-delà d’une certaine limite est un bon moyen de l’éviter pour autant qu’elle soit adoptée par ces grandes instances identifiées par les auteurs de l’article. Autrement, les anciens utilisateurs de twitter, habitués par la recherche de LA GRANDE INSTANCE, vont prioritairement ouvrir leur compte auprès de ces instances et accélérer ainsi une centralisation mal venue pour la qualité des échanges.
Dès lors aussi, l’augmentation du nombre de nouveaux utilisateurs rejoignant Mastodon, doit s’accompagner d’une augmentation proportionnelle d’instances pour les accueillir.
Ce message d’Eugen, fondateur de Mastodon, du 07 novembre 2022 est encourageant.
Il s’agirait aussi et peut-être de réfléchir à splitter (automatiquement) en deux les instances dès qu’elle atteignent un certains nombres de membres.
La décentralisation du web était la norme au début de l’Internet et elle doit le revenir. Pour notre bien commun.
Le lien vers l’article (en .pdf) : Raman, A. et al. (2019, October). Challenges in the decentralised web: The mastodon case. In Proceedings of the Internet Measurement Conference (pp. 217-229).