Cette année, c'est une toute nouvelle version du robot Heritrix qui va parcourir et collecter les quelque 5,2 millions de domaines qui composent la liste de sites de départ. Le volume de données collectées est évalué à environ 115 téraoctets. Une fois les pages web collectées, archivées et indexées, elles seront consultables grâce à l'application Archives de l'internet dans les salles de recherches de la BnF et dans les bibliothèques de dépôt légal imprimeur en régions.
En savoir plus sur :
Le Dépôt légal : une autre manière de coopérer
La carte des accès distants aux archives de l’interne