Le Catalogue Collectif de France ouvre ses données

Les données du CCFr sont passées sous Licence Ouverte depuis le 1er janvier 2018. Elles sont donc désormais réutilisables librement et gratuitement sous réserve d’en mentionner la source.

S’inscrivant dans le mouvement d’ouverture des données publiques (« Open Data ») encouragé par l’Etat, la Bibliothèque nationale de France a décidé d’adopter la licence ouverte, établie par la mission gouvernementale Etalab, pour les métadonnées gérées et diffusées par le CCFr dans l’ensemble de ses applications et services. Ceci s’applique à la fois aux données existantes et aux données destinées à intégrer le CCFr à l’avenir, facilitant et encourageant la réutilisation des données publiques mises à disposition gratuitement. 
 
La « Licence Ouverte » présente plusieurs caractéristiques notamment : 

  • Elle est ouverte, libre, gratuite et apporte une sécurité juridique nécessaire aux producteurs et aux réutilisateurs des données publiques.
  • Elle promeut la réutilisation la plus large en autorisant la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des données.
  • Elle s’inscrit dans un contexte international en étant compatible avec les standards des licences Open Data développées à l’étranger et notamment celles du gouvernement britannique (Open Government Licence) ainsi que les autres standards internationaux (ODC-BY, CC-BY 2.0).
  • Elle rend obligatoire la mention de la paternité faisant preuve d’exigence forte pour la transparence et la qualité des données.
  • Elle apporte des possibilités de mutualisation pour les autres données publiques en mettant en place un standard réutilisable par les collectivités territoriales.


Cette ouverture a pour vocation la valorisation des données des bibliothèques et doit faciliter leur mise en relation avec celles d'autres communautés présentes sur le web. Il s’agit là d’un enjeu majeur pour la mise en valeur et la diffusion des richesses patrimoniales des bibliothèques françaises.

Les données disponibles du CCFr

Le portail du CCFr, en interrogeant simultanément plusieurs catalogues nationaux ou régionaux, donne accès à plus de 30 millions de notices. Cela en fait l'outil de recherche bibliographique et documentaire le plus riche du domaine français. 
 
Une partie des données était déjà disponible sous Licence Ouverte 

  • La BnF l’a elle-même adoptée en 2014 pour l’ensemble des métadonnées diffusées dans ses applications bibliographiques, dont le Catalogue général et BnF Archives et manuscrits.
  • Elle a été retenue également par les bibliothèques de l’Enseignement supérieur et de la recherche pour leurs métadonnées bibliographiques dans Sudoc et Calames.

Les données de ces quatre catalogues interrogeables via le CCFr, sont donc déjà sous Licence Ouverte et sont disponibles auprès des producteurs concernés. 

  • En savoir plus sur la récupération et utilisation des données de la BnF
  • En savoir plus sur la réutilisation des données de l’ABES

En complément, plusieurs jeux de données sont, désormais, également disponibles sous Licence Ouverte 

  • La Base patrimoine qui regroupe plus de 6,6 millions de notices de documents patrimoniaux conservés dans les fonds anciens, locaux ou spécialisés de 197 établissements,
  • Le Catalogue général de manuscrits (CGM) qui abrite près de 900 inventaires provenant de 470 bibliothèques publiques,
  • Palme, répertoire permettant de localiser les manuscrits d’un même auteur du XXe siècle dans les différents établissements qui les conservent,
  • Le Répertoire des bibliothèques et fonds documentaires, donnant accès à la description de plus de 5 000 bibliothèques françaises et de près de 3  600 fonds documentaire

La récupération des données du CCFr

Depuis le portail du CCFr, il est possible de sélectionner des notices puis d’en demander le téléchargement, directement ou en passant par le panier. 
Les données sont disponibles en 

  • XML-EAD pour le CGM et Palme,
  • UNIMARC, ISO 2709 ou texte tabulé pour la Base Patrimoine,
  • XML pour le Répertoire.


Par ailleurs, des extractions complètes des bases sont ou seront prochainement possibles depuis plusieurs plateformes de données ouvertes 

  • data.gouv.fr, la plateforme ouverte des données publiques françaises,
  • data. culturecommunication.gouv.fr, la plate-forme de données ouvertes du ministère de la Culture
  • BnF API et jeux de données, portail d’accès aux jeux de données et API de la BnF.


Ces jeux de données (ou dumps en anglais) permettent de récupérer tout le contenu d’une base en une seule opération. Compte-tenu des volumétries, le contenu d’une base peut cependant être découpé en plusieurs fichiers. 
Au-delà de cette première étape, l’ouverture des données du CCFr se poursuivra avec des mises à jour régulières des jeux de données existants ou de nouvelles extractions correspondant à des corpus spécifiques. De nouveaux formats de fichiers devraient également faire leur apparition en même temps que des outils permettant un accès direct aux bases de données. Dans ce cadre, c’est avec le plus grand soin que seront examinées les remarques et suggestions des utilisateurs, afin de proposer les réponses les plus adaptées à leurs besoins

 

Type de ressouce: