La documentation régionale

Pour tout savoir sur Lyon, la Métropole et la Région, dans tous ses aspects, histoire et actualité, patrimoine et nature...

Guide des archives de l’internet

Les archives de l’internet sont désormais consultables à la Bibliothèque municipale de Lyon. Plongez dans les abysses du web !

Dès 1999, la Bibliothèque Nationale de France a décidé que sa mission de conservation patrimoniale devait s’appliquer à l’internet et aux publications numériques en ligne. Depuis 2006, cette nouvelle mission est réglementée par le Code du patrimoine. Désormais, les archives de l’internet sont accessibles dans les bibliothèques qui sont pôles associés de la BnF pour la collecte du dépôt légal, dont la Bibliothèque municipale de Lyon.

Que contiennent les archives du web ?


-  des échantillons représentatifs de l’internet français depuis 1996 : des sites en .fr, et hors .fr (.com, .org…) mais dont les producteurs sont domiciliés en France ou dont les contenus sont produits en France ;
-  en janvier 2015, les archives de l’internet à la BnF contiennent plus de 23 milliards de fichiers, soit 567 téraoctets.

Comment ces échantillons ont-ils été constitués ?


-  depuis 2004 lors de larges collectes annuelles permettant de constituer des échantillons de plusieurs millions de sites, principalement en .fr ;
-  lors de collectes ciblées, qui permettent de constituer des archives thématiques plus complètes, par exemple dans le domaine de la littérature, du développement durable ou encore liées à un évènement tel les élections ;
-  par l’acquisition d’un corpus représentatif remontant à 1996.

Comment peut-on y accéder ?


-  les archives sont stockées sur les serveurs de la BnF ;
- on peut les consulter en salle de lecture à la Bibliothèque nationale de France ;
-  on peut les consulter à la Bibliothèque municipale de Lyon qui est pôle associé de la BnF pour la collecte du dépôt légal ;
-  il est impossible pour l’instant d’accéder à ces archives à distance.

Quels sont les modalités à la BmL ?


-  les archives sont consultables à la Bibliothèque de la Part-Dieu, Documentation régionale ;
-  comme pour tous les documents du dépôt légal, les chercheurs qui souhaitent avoir accès à ces archives doivent déposer une pièce d’identité pendant la durée de la consultation ;
-  la consultation a lieu sur un poste dédié.

Comment naviguer dans ces archives ?


-  grâce à la recherche par URL
-  grâce à la recherche par mot, sur un petit échantillon d’archives
-  grâce à des parcours guidés tels que : presse, commémoration, web scientifique, carnets de voyage, le web vert, l’internet électoral…

Quels sont les services associés ?


-  l’accès à l’internet vivant pour retrouve une URL ;
-  la possibilité de copier des extraits de textes et de faire des copies d’écrans ;
-  il est interdit de télécharger des contenus.

NB
-  certains sites ont été capturés tous les jours et même plusieurs fois par jour ;
-  certains sites ne présentent que leur page d’accueil ou un petit nombre de pages ;
-  certains contenus ont pu poser des difficultés de collecte (contenus payants, ou soumis à mot de passe, flux audio…
-  la mise en page du site archivé ne correspond pas toujours à la mise en page du site d’origine.