Attention, ça déborde ! Les déchets, ultime visage de notre modèle de consommation devenu délirant, menacent de nous ensevelir. Le dessin animé Wall-E, décrivant une planète Terre métamorphosée en gigantesque décharge, abandonnée par ses habitants, se révélerait-il prophétique ? De Naples recouverte périodiquement d’immondices à l’espace proche, empli de débris spatiaux, la situation semble souvent hors de contrôle. Le trop-plein de déchets guette également les disques durs de nos ordinateurs, selon une étude publiée par Ragib Hasan et Randal Burn, chercheurs à l’université Johns-Hopkins de Baltimore (États-Unis), qui proposent une stratégie pour désengorger nos ordinateurs des ordures digitales qui y pullulent.

L’analyse des données contenues dans un MacBook personnel indique qu’un fichier sur cinq n’a jamais été ouvert depuis sa dernière modification : ces données, qui ne sont pas utilisées par l’ordinateur, représentent 98,5% de la mémoire utilisée ! Autant de fichiers-déchets qui ne présentent pas d’utilité pour le fonctionnement des logiciels. Et bien que les capacités de mémoire augmentent de façon exponentielle avec le temps, les ressources de l’écosystème digital restent finies, comme le rappellent les deux chercheurs.

La gestion de cette masse d’ordure digitales consomme une part importante de ces ressources, leur stockage requérant de l’espace sur le disque et de l’électricité pour assurer son fonctionnement. La question de la facture énergétique du stockage des données numériques devient un sujet central de la nouvelle économie. Google a créé sa propre filiale, Google Energy, afin de produire elle-même les térawattheures qu’elle consomme pour réfrigérer ses serveurs, alors que l’Islande espère tirer profit de ses températures plus que clémentes pour refroidir à moindre frais les datacenters du monde entier.

Plutôt que de stocker des fichiers inutiles, il suffirait de s’en débarrasser, me direz-vous. Or compresser, voire supprimer des fichiers coûte également de l’énergie ; les opérations répétées d’écriture-effacement peuvent aussi endommager les supports de mémoire Flash, de plus en plus répandus, réduisant d’autant leur durée de vie. Sachant qu’une étude datant de 1999 montrait que 80 % des fichiers étaient effacés dans les 4 secondes suivant leur création, on peut songer à d’autres utilisations des fichiers informatiques.

Le cimetière des fichiers inconnus

Le centre de données du service Bing Maps de Microsoft, stockant plus de 5 pétabits (soit 5 millions de milliards de bits). On peut se faire ici une impression du bruit produit par le système de refroidissement.

Les chercheurs américains distinguent plusieurs sources de déchets dans nos disques durs : certaines données ont été créées de façon non intentionnelle (les fichiers conservés après l’installation d’un programme), de vieux fichiers sont laissés à l’abandon (l’arborescence est remplie de dossiers oubliés), d’autres sont devenus obsolètes après la mise à jour du logiciel associé, ou sont stockés alors qu’ils ne servent à rien (tels les tutoriels rédigés en une vingtaine de langues étrangères). Une stratégie en cinq étapes vise à réduire à néant la quantité des déchets digitaux :

1. réduire les déchets, par exemple grâce à des pénalités imposées par le système d’exploitation (Windows, Linux…) aux logiciels créant un trop grand nombre de fichiers temporaires polluant l’espace de stockage : ce principe “pollueur-payeur” ferait que les logiciels “pollueurs” seraient par exemple rétrogradés par le système d’ordonnancement d’E/S, fixant l’ordre dans lequel les informations transitent par le processeur, au profit de logiciels plus vertueux dans leur gestion de la mémoire ;

2. réutiliser les fichiers obsolètes : comme l’on donne une seconde vie aux objets (dans les ressourceries, ou chez Emmaüs), on pourrait imaginer le réemploi de fichiers abandonnés par le processus de déduplication : les fichiers sont découpés en petits modules pouvant être utilisés par d’autres fichiers, lesquels seront ainsi moins volumineux puisqu’ils utiliseront des modules déjà présents dans la mémoire de l’ordinateur ;

3. recycler les codes : lors des mises à jour de certains logiciels, certains fichiers installés avant la précédente version pourraient être récupérés, au lieu de réinstaller totalement la suite de codes ;

4. récupérer les données : les fichiers voués à la destruction contiennent des informations renseignant sur leur utilisation : une fois les informations extraites anonymisées, ce “retour sur expérience” pourrait être mis à profit par les concepteurs de logiciels qui, connaissant mieux les habitudes des utilisateurs, adapteront en conséquence leurs produits ;

5. détruire les déchets ultimes, faute d’alternative plus durable.

Ces priorités, adaptées des techniques de gestion des déchets matériels, inspirent déjà les systèmes d’exploitation libres tels que les distributions Linux. Verront-elles le jour bientôt sur les systèmes payants ? On espère que ceux-ci prendront d’eux-mêmes à bras-le-corps ce problème majeur, sans attendre de réglementation contraignante qui sont souvent en décalage avec la technologie informatique.

Source : R. Hasan et R. Burns, The Life and Death of Unwanted Bits: Towards Proactive Waste Data Management in Digital Ecosystems, arXiV, 1er juillet 2011.

Crédits photo : Ken Faber (CC BY-NC-SA 2.0) ; Robert Scoble (CC BY 2.0).