vendredi, avril 17

Située à San Francisco, l’organisation à but non lucratif Internet Archive existe depuis 1996 et a archivé “plus de 1 000 milliards de pages web”, retrace Wired. Son outil Wayback Machine, soit “machine à remonter le temps”, permet notamment aux internautes de savoir à quoi ressemblait un site donné à une date donnée.

Mais ces archives numériques sont aujourd’hui menacées, alerte le bimensuel américain. Car bien qu’ils soient eux-mêmes utilisateurs d’Internet Archive, de grands médias comme The New York Times ou USA Today s’opposent à l’archivage de leurs contenus.

“En mars, USA Today a publié un excellent article qui montrait comment l’ICE [la police fédérale de l’immigration américaine] avait sciemment tardé à divulguer des données cruciales sur les effets de sa politique de rétention”, signale Wired. Et “si [les journalistes] parviennent à étayer aussi bien leurs recherches, c’est grâce à la Wayback Machine”, rappelle son directeur, Mark Graham. Mais “en même temps, ils lui bloquent l’accès”.

La crainte de l’intelligence artificielle

Vingt-trois grands sites d’information bloquent ia_archiver, le “robot d’indexation généralement utilisé par l’ONG Internet Archive pour son projet Wayback”, informe le magazine californien. La plateforme Reddit est aussi concernée. D’autres médias, comme le quotidien britannique The Guardian, “ne bloquent pas le robot d’indexation, mais ils excluent leurs contenus de l’API [interface de programmation] de l’Internet Archive et retirent leurs articles de l’interface de la Wayback Machine. Il est donc plus compliqué, pour le citoyen lambda, d’accéder aux versions archivées des médias.”

L’argument majoritairement évoqué est celui d’une crainte que ces archives ne soient utilisées par des entreprises de la tech afin d’entraîner leurs modèles d’intelligence artificielle, sans égard pour le droit de la propriété intellectuelle.

Aux États-Unis, des journalistes s’opposent à cette tendance, insistant sur le rôle majeur d’Internet Archive dans le “travail de sauvegarde des archives du journalisme”, note Wired. Car ces données permettent une “vérification des faits”, voire, pour un média, un suivi chronologique des “fluctuations de la rémunération”. Et au-delà du journalisme, “les pages archivées par cet outil servent régulièrement de pièces à conviction dans les procédures judiciaires sur l’ensemble du territoire américain”.

[…] Lire la suite sur Courrier international

Sur le même sujet :

Share.
Exit mobile version