
La série de billet continue, nous en sommes au neuvième, dans lequel je tente de rassembler au fur et à mesure de mes découvertes des pistes de travail pour découvrir, comprendre et se former sur les données de la recherche...Ils sont de plus en plus longs et denses…preuve si besoin du développement de ce sujet, de ces questionnements, des outils et des pratiques !
Si vous avez d'autres sites ou des suggestions n'hésitez pas !!
Revoir le premier billet : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation
Relire le second épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_2
Relire le troisième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_3
Relire le quatrième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_4
Relire le cinquième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_5
Relire le sixième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_6
Relire le septième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_7
Relire le huitième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_8
43 - A lire des analyses, définitions et points de vues généraux
- Bilan de 15 ans de réflexion sur la gestion des données numériques de Gautier Poupeau sur le blog Les Petites Cases - A lire absolument ce billet de synthèse qui permet vraiment de faire le point sur les problématiques et les évolutions de la gestion de données
- Data Curation as Publishing for the Digital Humanities, Trevor Muñoz - un texte passionnant qui tente de penser la gestion des données comme un "processus éditorial" et qui redéfinit le professionnel de l'info dans le procesus de gestion des données comme un éditeur...
- Les données ouvertes et la recherche : quel état des lieux ? - Sur Sciences Communes, une synthèse du rapport de figshare, intitulé The State of Open Data, qui est une sélection de divers papiers de recherche écrits par des scientifiques de différentes universités, de représentants associatifs et d’experts du secteur privé. Le sujet est assez vaste et parle des données ouvertes en général, même si les données de la recherche y ont une place notable.
- Chronologie des humanités numériques - Un travail proposé par le carnet des Digital Libraries & Information Sciences qui a pour objectif de mettre en perspective les apports successifs des technologies du texte et des travaux scientifiques qui les accompagnent
- Histoire et Humanités numériques : une bibliographie introductive - Dans le cadre d’une UE optionnelle intitulée « Initiation aux humanités numériques » au sein du Master Recherche « Métier d’historien » de l’université de Lille, les participant-es ont élaborée collectivement au fil du semestre cette bibliographie introductive.
- Où sont les données de la recherche ? : Essai de cartographie - Un essai de cartographie des initiatives et acteurs visibles en France concernant les données des sciences humaines et sociales.
et deux synthèses sur les conséquences de la loi numérique sur les données
- Quel statut pour les données de la recherche après la loi numérique ? de Lionel Maurel - https://scinfolex.com/2016/11/03/quel-statut-pour-les-donnees-de-la-recherche-apres-la-loi-numerique/
- Retour en images sur la journée TDM « Fouille de textes et de données dans le contexte de la loi pour une République numérique » - http://adbu.fr/retour-en-images-sur-la-journee-tdm-fouille-de-textes-et-de-donnees-dans-le-contexte-de-la-loi-pour-une-republique-numerique/
44 - Des ressources autour des Data papers et du lien publications / données
- Améliorer l’exposition des données de la recherche : la publication de data papers - Ce texte de Nathalie Reymonet de Paris7 présente la structure et le contenu d'un « data paper » ainsi que des exemples de revues qui publient de tels articles
- Sélection de revues publiant des Data papers - http://coop-ist.cirad.fr/actualites/selection-de-revues-publiant-des-data-papers
45 - Des billets plus pratiques et techniques
- Deux billets de Gautier Poupeau sur le blog Les Petites Cases : Du problème de la qualité des données et de la manière de le résoudre - avec une vrai analyse de plusieurs outils de nettoyage de données et Comment mettre la donnée au coeur du SI ? ou comment "casser les silos de données pour offrir une vision transverse et cohérente de nos données et permettre l’apparition d’usages transverses de nos données" -
- Une feuille de route pour les citations des données dans les entrepôts - Cet article synthétise et harmonise les principales recommandations existantes et présente 11 recommandations regroupées selon trois niveaux de priorité de mise en place.
- Master PEEN & Humanités numériques : un exemple de réalisation d’édition numérique - toutes les étapes nécessaires à la création d’une édition numérique sont passées en revues : de la réflexion sur la conception, la définition des choix éditoriaux et méthodologiques dans les conditions de l’interopérabilité, jusqu’à qu’à la réalisation concrète pour s’achever sur la mise en ligne au sein du corpus textuel BVH
- Les données de la recherche et leurs entrepôts, de la documentation à la réutilisation : étude de cas pour l’archive HAL -une étude exploratoire des données supplémentaires hébergées par HAL, qui cherche à identifier quelles communautés scientifiques utilisent ce service et sous quelles formes
- Structurer les données de la recherche en EAD : l’exemple du traitement de l’ANR Colostrum - C’est dans le cadre du traitement, de la diffusion et de la valorisation des données de la recherche – au cœur du travail de la Phonothèque de la MMSH – que s’inscrit le catalogage en EAD de l’ANR Colostrum
46 - Des outils à tester et des ressources à découvrir
- 80 archives de dépôts de données scientifiques (springer Nature) - Une liste commentée de 80 archives, classées par catégories, permettant le dépôt des données numériques accompagnant la publication d’un article. Lien
- Alix est une librairie logiciel libre pour la fouille lexicale, activement développée en ce moment par Frédéric Glorieux dans le contexte du LABEX OBVIL. Cette démonstration en ligne est pour l’instant destinée à la mise au point des fonctionnalités avec les chercheurs intéressés - http://obvil.lip6.fr/alix/
- La « Huma-Num box » : vers un stockage distribué en réseau - https://humanum.hypotheses.org/2711
- OpenRefine au service de BACON : quelle évaluation pour les fichiers KBART ? [2] – OpenRefine est un outil open source conçu pour manipuler des données dont la qualité nécessite un traitement. Mais il permet bien plus que de nettoyer un fichier tabulé des scories qu’il contient
- Créer des référentiels SKOS/RDF à partir d’Excel : http://blog.sparna.fr/2017/01/12/creer-des-referentiels-skosrdf-a-partir-dexcel/
- Une ressource nouvelle, la revue Analyses et méthodes formelles pour les humanités numériques
- Ouverture du catalogue en ligne Archipolis qui permet de consulter en ligne le catalogue des enquêtes qualitatives en science du politique, recensées par les unités de recherche membres du consortium Archipolis
47 - Les pages guides, formations ou tutoriels
- Deux billets sur le blog du CCSD sur Comment diffuser mes données de recherche ? (1/2) - les étapes d’archivage et de partage des données de recherche, en gardant à l’esprit les objectifs de préservation, de diffusion ainsi que de validation et de réutilisation des données inhérents à ces étapes et Comment diffuser mes données de recherche ? (2/2) qui propose une série d’outils de recherche et d’évaluation d’entrepôts de données de recherche
- L’inra s’engage sur le partage des données, en diffusant une Charte pour le libre accès aux publications et aux données et avec un site web, Datapartage, pour accompagner la gestion des données et présenter l’offre de services «gestion et partage des données ». Le site propose 4 rubriques : Gérer, Partager, Réutiliser et Technologies. Les services proposés sont : attribuer un DOI à un jeu de données INRA, choisir un entrepôt pour déposer ses données, écrire un plan de gestion de donnés à l’aide d’un site dédié et des formations et publier un vocabulaire ou une ontologie. Une offre de formation se met progressivement en place à travers les infodoc express et les classes virtuelles
- L'Inist met à disposition un outil d'aide à la préparation et à la rédaction des plans de gestion de données (ou DMPs) - Outil en ligne intuitif et collaboratif, DMP OPIDor permet de rédiger facilement un plan de gestion de données en utilisant des modèles génériques préconisés par les institutions et les financeurs. Il est basé sur le logiciel libre développé par le Digital Curation Centre, du Royaume-Uni et a déjà testé auprès de très nombreuses équipes de recherche au Royaume-Uni et en Europe, notamment dans le cadre des projets Horizon 2020 qui en recommandent l'utilisation. https://dmp.opidor.fr
- Traduction française des guides pour Horizon 2020 avec le second guide (version 3.0 du 26 juillet 2016) qui fournit les lignes directrices concernant la gestion des données selon les principes FAIR (findable, accessible, interoperable, reusable)
- 6è journée Nationale d’Etude des Urfist JNE 2016 : Partage des données de la recherche - L’objectif de l’édition 2016 : les données de la recherche (DR) constituent une modalité relativement nouvelle de la publication des travaux, mais également de publicisation des données qui en sont le fondement. Deux volets ont balisé ce séminaire : Définition, circonscription et contextualisation du concept de Données - Modalités pratiques de la production et de l’exploitation des données - https://urfistinfo.hypotheses.org/jne/6e-journee-nationale-detude
- DN Nord, avec la prise de notes collaborative https://meshs.titanpad.com/9? et les vidéos : http://publi.meshs.fr/ressources/view#text=DHnord2016 avec par exemple
- De l'édition à l'éditorialisation. Pour une approche historique des éditions de correspondances par Marie Dupond, post-doctorante au réseau "Usages des patrimoines numérisés", Université Sorbonne Paris-cité
- La contribution du numérique à la transformation des musées et de la muséologie par Jean-Christophe Vilatte, maître de conférences à l'Université de Lorraine et Céline Schall, post-doctorante à l'Université du Luxembourg
- Retours d'expériences (utilisation de logiciels, exploration de discours à travers le web, étude de langage) par Laure Pairet, Maître de Conférence à l'université Picardie Jules Verne
48 - Deux billets sur le cas particulier de l'archéologie du point de vue de la gestion des données numériques
- Colloque « Archivage, publication et mise à disposition de données archéologiques » : les vidéos sont en ligne - https://masa.hypotheses.org/270
- Médiation sémantique appliquée aux données de fouilles archéologiques - Intervention de Béatrice Bouchou-Markhoff (LI, Université François-Rabelais, Tours) et Olivier Marlet (CITERES, CNRS-Université François-Rabelais, Tours)
- Traitements de la documentation archéologique conservée au Centre Camille Jullian : Fréjus, Cherchel et fonds G. Souville - Intervention de Véronique Blanc-Bijon, Stéphanie Satre et Bruno Baudoin (Centre Camille Jullian)
- Open Access and Open Data in Archaeology: Following the Ariadne Thread - https://dougsarchaeology.wordpress.com/2017/01/04/open-access-and-open-data-in-archaeology-following-the-ariadne-thread/
49 - Des exemples de la manière d'organiser et d’accompagner la gestion des données dans d'autres pays
- Towards a Collaborative National Research Data Management Network - Canada - http://www.ijdc.net/index.php/ijdc/article/view/11.1.195
- Building A Research Data Management Service at UC Berkeley - http://escholarship.org/uc/item/1xn897d0#page-1
- DANS - Data archiving and network services – Danemark - DANS promotes sustained access to digital research data files and encourages researchers to archive and reuse data - https://dans.knaw.nl/en/front-page?set_language=en
50 - Des applications pratiques pour des bibliothèques numériques, des bibliothèques et les données
- Approches innovantes pour la presse ancienne numérisée : fouille et visualisation de données : https://bnf.hypotheses.org/208
- Bibliothèques et Open data : retour d’expérience de la Bibliothèque départementale des Côtes d’Armor - https://dlis.hypotheses.org/985
- Les données, quel enjeu pour la recherche et les bibliothèques?: http://bibliotheque-blogs.unice.fr/httbu/2017/01/06/les-donnees-quel-enjeu-pour-la-recherche-et-les-bibliotheques/
- L’uniformisation et la pérennité des données dans les bibliothèques numériques : le cas du logiciel libre Omeka à la Bibliothèque interuniversitaire de la Sorbonne - https://chartes.hypotheses.org/1505
- Pour comprendre l'IIIF (International Image Interoperability Framework) qui est un ensemble de standards dont l’objectif est de définir un cadre d’interopérabilité pour les bibliothèques numériques : http://bsa.biblio.univ-lille3.fr/blog/2016/11/comprendre-iiif-interoperabilite-bibliotheques-numeriques/