
La série de billet continue, nous en sommes au huitième, dans lequel je tente de rassembler au fur et à mesure de mes découvertes des pistes de travail pour découvrir, comprendre et se former sur les données de la recherche...
Si vous avez d'autres sites ou des suggestions n'hésitez pas !!
Revoir le premier billet : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation
Relire le second épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_2
Relire le trosième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_3
Relire le quatrième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_4
Relire le cinquième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_5
Relire le sixième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_6
Relire le septième épisode : http://corist-shs.cnrs.fr/gestion_donnees_recherche_guideetformation_7
36 - A lire des analyses, définitions et points de vues généraux
- Humanités numériques, Architecture de l’information : des réponses à un changement de paradigme documentaire de Jean-Philippe Magué - "A travers la redéfinition du rôle, de la place et du regard que portent nos sociétés sur les documents, c’est une redéfinition du rapport au savoir qui s’écrit. Et c’est précisément ce que sont les Humanités Numériques : la manière dont nous nommons ce nouveau rapport au savoir en train de se constituer."
- RFSIC dossier spécial "Humanités Numériques et Sciences de l’Information et de la communication" sous la direction de Julia Bonaccorsi, Valérie Carayol et Jean-Claude Domenget et notamment "Les SIC à l’épreuve du digital et des Humanités : des origines, des concepts, des méthodes et des outils" de Franck Cormerais, Olivier Le Deuff, Amar Lakel et David Pucheu
- Le dossier thématique "Web de données et création de valeurs : le champ des possibles" de la revue I2D – Information, données & documents 2/2016 (Volume 53), et notamment cet article de Lise Verlaet et Hans Dillaerts "L’enjeu du web de données pour l’édition scientifique" qui présente le concept d’éditorialisation sémantique et explicite les opportunités de l’enrichissement sémantique des publications scientifiques pour l’ensemble des acteurs de l’IST (auteurs, éditeurs et professionnels de l’information)
- Le dossier d'Arabesque n°83 juillet sept 2016 " Dossier Créer du lien, faire sens - Un nouveau souffle sur les données" : Ce dossier est notamment l’occasion pour l’Abes de revenir sur ses premiers pas dans le web de données mais aussi de présenter ses derniers travaux en la matière : la mise en ligne d’une vaste base de données RDF, « défense et illustration pédagogique d’une approche web sémantique de l’interopérabilité des données de l’IST »
37 - Deux ressources autour des Data papers et du lien publications / données
- The Scholix framework pour Scholarly Link Exchange : La Research Data Alliance (RDA) et le International Council for Science World Data System (ICSU-WDS) ont annoncé un nouvel environnment pour lier les publications et les données de la recherche. Scholix consiste a un ensemble de principes et de guides pratiques pour implémenter des services facilitant la réutilisation, la reproductibilité des données et l’évaluation transparente de la science - http://ist.blogs.inra.fr/technologies/2016/08/16/scholix-lier-les-donnees-de-la-recherche-et-la-litterature-scientifique
- The Journal of Open Archaeology Data (JOAD) features peer reviewed data papers describing archaeology datasets with high reuse potential. We work with a number of specialist and institutional data repositories to ensure that the associated data are professionally archived, preserved, and openly available. Equally importantly, the data and the papers are citable, and reuse is tracked - http://openarchaeologydata.metajnl.com/
38 - Des billets plus pratiques et techniques
- Le billet d'Antoine Courtin "Exploiter/visualiser/explorer un corpus issue de l’OAI-PMH grâce au duo OpenRefine/Palladio" - D’une requête OAI à une exploitation des données par l’intermédiaire d’un outils d’infoviz (en passant par du nettoyage de données, de la géolocalisation, etc.)" - il s’agit ici d’un exemple d’utilisation à partir d’un micro-ensemble non exhaustif et donc avec de nombreuses lacunes. Ce billet n’a donc pas pour objectif de tirer des conclusions — elles seraient très vites trompeuses — mais de proposer une suite d’opérations pouvant être appliquées (soit dans son ensemble soit en prenant des “bouts”) à d’autre corpus, plus cohérent (mais c’est votre boulot;-)). De plus, je vais aborder qu’une infime partie des fonctionnalités des outils en faisant des raccourcis.
- Deux billets autour de Databnf : celui de frédéric Glorieaux "Databnf, les documents" qui présente une application d’exploration du catalogue de la BnF à partir des données téléchargeables sur data.bnf.fr (livraison avril 2016) et celui d'Etienne Cavalié "Ce qu’il y a dans data.bnf.fr" une navigation qui permet simplement de se rendre compte de ce qu’il y a comme types d’objets dans data.bnf.fr, en quelle quantité, et liés à quels autres types d’objets
- La série de billet d'Etienne Cavalié sur le blog Bibliothèques reloaded autour de la journée Afnor BNF sur l'open data : Journée Afnor/BnF sur l’open data du 24 juin 2016 (1/5) : Eléments préliminaires + le ROI de l’ouverture des données - Journée Afnor/BnF sur l’open data du 24 juin 2016 (2/5) : Open data et records management - Journée Afnor/BnF sur l’open data du 24 juin 2016 (3/5) : DataBnF et ArchivesFrance.fr - Journée Afnor/BnF sur l’open data du 24 juin 2016 (4/5) : la table ronde, les archives et la politique d’open data - Journée Afnor/BnF sur l’open data du 24 juin 2016 (5/5) : partager son EAD
39 - Des outils à tester
- Open knowledge Maps une interface visuelle pour chercher dans les contenus scientifiques - est une initiative pour créer des interfaces visuelles interactives utilisant des techniques de visualisation de données et de text mining qui peuvent être utilisées par tous pour améliorer la découverte de résultats de recherche
- Opendatamonitor un site pour trouver, analyser et comparer des données ouvertes - Opendatamonitor “moissonne” des catalogues de données et permet de localiser des jeux de données ouvertes tout en informant sur leur degré d’ouverture
- OpenDataSoft liste des Portails Open Data dans le Monde : 2600 portails avec carte interactive et liste
- re3data.org liste 1500 entrepôts de données de recherche, avec des tris possibles par sujets, pays, par contenus
- Elsevier Datasearch un nouveau moteur de recherche des données de la recherche qui s’inscrit dans la stratégie de positionnement d’Elsevier sur les services pour la gestion des données de la recherche. Pour rappel, en novembre 2015 apparaissait Mendeley Data, une fonctionnalité du logiciel Mendeley, racheté par Elsevier en 2013, pour stocker et diffuser des données. Datasearch permet de chercher dans les entrepôts de données de recherche principaux mais aussi dans les supplementary data. L’outil est pour l’instant en version bêta donc encore sous développement - http://ist.blogs.inra.fr/technologies/2016/09/02/elsevier-datasearch-un-nouveau-moteur-de-recherche-des-donnees-de-la-recherche/
40 - Les pages guides, formations ou tutoriels
- Les interventions de la journée Humanités numériques et données ouvertes du 24 et 25 mai à Lyon avec notamment Programmes de recherche et données numériques : comprendre les enjeux du plan de gestion de données (Data management plan) pour les chercheurs – Geneviève Romier (CNRS Institut des grilles et du Cloud), Emmanuelle Morlock (Hisoma)
- Le programme e-Learning du Portail Européen de Données. Ce programme a été conçu afin de vous permettre de découvrir ce qu’est l’open data et comment cela peut contribuer à faciliter la vie des personnes sur notre planète. Exemples : Cours 1 - L’open data, c’est quoi ? - Cours 4 - Quelle est l’importance d’une licence ? - Cours 8 - Maîtriser les plateformes d'open data - Cours 11 - Comment nettoyer les données - Cours 13 - Lire le web de données
- Sur le site de Form@doct 4 vidéos d'une matinée d'étude doctorale de 2016 "Les datas : quels changements pour la recherche et pour les chercheurs ?" Les données de la recherche, ou la recherche guidée par les données ? - Les données de la recherche en pratique - Les enjeux de l'ouverture des données de la recherche
- Nouvelle version 3.0 des guides pour Horizon 2020 mis en ligne par la Commission européenne et destinés aux chercheurs bénéficiant de financement dans le cadre d’Horizon 2020 : Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 - Guidelines on FAIR Data Management in Horizon 2020
41 - Deux billets très pratiques et un article théorique sur le Web de données et les bibliothèques numériques
- Le billet d'emmanuelle Bermès "L’évolution du modèle d’agrégation de données dans les bibliothèques numériques" - J’ai rassemblé dans ce billet quelques réflexions et observations qui m’ont été inspirées notamment par mes travaux au sein d’Europeana ces derniers mois. Tout est parti du sentiment diffus que l’agrégation telle qu’on la connaît actuellement est en train d’évoluer, même s’il est difficile de savoir vers quoi, car je n’ai pas lu de théorie très construite sur le sujet. Donc à défaut de l’avoir trouvée résumée ailleurs, je la propose ici aujourd’hui
- Récit d’une immersion. Traiter les ebooks Dalloz avec les données Sudoc, les données de l’éditeur et les outils du hub - Ce billet relate à la première personne l’immersion effectuée par Catherine Storne (Université de Strasbourg) au sein de l’équipe hub de l’ABES, entre le 1er et le 5 février 2016. Catherine a eu l’occasion de partager cette expérience aux dernières journées ABES
- "Le catalogue des bibliothèques et ses données à l'heure du web" - Le point de vue de cet article est de décrire la logique du web et du web de données à la lumière des enseignements de Michel Foucault, tels qu'on peut les lire, notamment, dans Les Mots et les Choses (1966). Dans un premier temps, les données sur le web jouent le rôle que jouait au XVIIe siècle la monnaie : à la fois représentation des richesses, substitution dans le cadre d'échange différés et mesure de la valeur, en l'occurrence, de l'attention que leur attribuent les acteurs du web. Du point de vue de la gestion de l'attention, deux visions économiques s'affrontent sur le web : l'une, plutôt utilitariste, s'attache à définir la valeur du point de vue de la subjectivité humaine et du besoin, l'autre, plutôt physiocrate, cherche à transformer l'abondance d'information pour la découper et la synthétiser. Le Web de données quant à lui, reflète ces deux logiques au sein même du langage qui sert à l'exprimer : le RDF reproduit à sa manière l'attribution qui est le principe du lien hypertexte, tandis que les ontologies donnent à lire une classification du monde et des données qui le représentent. D'une certaine manière, la logique épistémologique des données massives bouleversent quelque peu la logique représentationnelle du web, leur principe fondamental n'étant plus l'analyse ou la critique, mais bien la recherche de corrélation, la mise en parallèle, le commentaire
42 - Deux billets et une étude sur le Big data
- Le billet d'Internet Actu Il est plus que temps que le Big data évalue ses impacts à propos de Cathy O’Neil data scientist (blog, @mathbabedotorg) Docteur en mathématique de Harvard, elle vient de publier un livre intitulé Armes de destruction matheuses expliquant comment les Big Data augmentent les inégalités et menacent la démocratie, comme le soulignait une récente interview d’elle dans Rue89. Elle a beau être une spécialiste des données et de leurs traitements, elle n’en est pas moins très sceptique et critique sur l’utilisation que nous en faisons
- Pour la sociologue Evelyn Ruppert, il faut un regard autre que technique sur le big data. Sociologue des data, elle lance un site d’analyse transdisciplinaire sur les big data, "Big Data and Society" Pas de technologies de stockage ni de traitement informatique au programme, mais des conversations scientifiques autour des impacts sociaux et culturels de ce phénomène
- L'Observatoire des usages du big data - Très complet, cet observatoire propose avant tout une étude approfondie à télécharger composée de trois volets : une vision d'ensemble présentant le contexte actuel, une analyse globale multisecteurs et un examen approfondi de l'impact du big data sur cinq secteurs cibles. En plus de ce rapport, le site internet de cet observatoire propose également une veille quotidienne sur les usages et les dernières avancées du big data. Enfin, l'Observatoire des usages du big data a listé l'ensemble des formations initiales, continues et en ligne (Mooc) préparant les futurs professionnels aux métiers du big data.