jun 30
Werksessie FAIR data - LCRDM & UKB - juni 2017 / Work session FAIR data - June 2017

Op 22 juni 2017 organiseerde het Landelijk Coördinatiepunt Research Data Management (LCRDM) samen met de UKB werkgroep Research Data (UKBwg RD) een werksessie over FAIR data. Het doel van deze sessie was om input te genereren voor en positie te bepalen met betrekking tot ambitie 3.2.1 in het Nationaal Plan Open Science (NPOS), specifiek vanuit het ondersteunersperspectief. NPOS-ambitie 3.2.1 valt onder hoofdlijn 2.1 - Onderzoeksdata optimaal geschikt maken voor hergebruik. De ambitie is te komen tot een consistent systeem voor het FAIR ontsluiten van onderzoeksdata. Het LCRDM staat bij deze ambitie vermeld als ondersteunende stakeholder. Bij de sessie waren collega's aanwezig die lid zijn van de UKB Werkgroep Research Data of van een van de werkgroepen van het LCRDM. Sommigen hadden een dubbele pet op en belichtten in de introductie de FAIR-activiteiten binnen hun instellingen. Ook was er vertegenwoordiging vanuit de hogescholen aanwezig.

In het eerste deel van de bijeenkomsten belichtten vijf sprekers in korte presentaties verschillende kanten van FAIR data.

 FAIR data principles.jpg
CC-BY-SA-4.0 Sangya Pundir

Marcel Ras (NCDD, tevens lid LCRDM Werkgroep Financiële aspecten) besprak duurzame data in de erfgoedsector. Het begrip 'FAIR' wordt in deze sector niet gebruikt. Wel is het in de erfgoedsector belangrijk dat data zichtbaar (F, A), bruikbaar (I, R), en houdbaar (R) zijn. In deze sector spreekt men over duurzame toegang. Het Netwerk Digitaal Erfgoed heeft in 2014 een “nationale strategie voor digitaal erfgoed" opgesteld. Deze strategie definieert de kaders voor een brede samenwerking die ervoor moet zorgen dat digitale collectie in Nederland beter zichtbaar gemaakt worden voor eindgebruikers, beter aan elkaar geknoopt worden zodat zichtbaarheid meer integraal wordt en collecties voor de lange termijn toegankelijk blijven. Binnen de erfgoedsector komen steeds meer collecties digitaal beschikbaar, maar de verschillende infrastructuren die deze collecties zichtbaar maken moeten nog meer met elkaar verbonden worden. Om deze nationale strategie handen en voeten te geven zijn er drie werkprogramma's gestart waarbinnen projecten uitgevoerd worden die werken aan gemeenschappelijke voorzieningen. Deze werkprogramma's worden uitgevoerd door het Netwerk Digitaal Erfgoed (NDE).

Er zijn vanuit de Nationale Coalitie Digitale Duurzaamheid (NCDD) flinke stappen gezet naar een bredere en domeinoverstijgende samenwerking om duurzame toegang te bewerkstelligen. De NCDD participeert binnen het Netwerk Digitaal Erfgoed als uitvoerder van het werkprogramma Digitaal Erfgoed Houdbaar. Zo is er een catalogus van duurzaamheidsvoorzieningen ontwikkeld, een Wiki opgezet waarin de elementen van duurzaamheidsbeleid worden weergegeven, een kostenmodel gemaakt, en is er een digitale leeromgeving gerealiseerd.

 Marcel Ras - Digitaal Erfgoed Houdbaar.pptx


Jasmin B
öhmer (TU Delft & 4TU Centre for Research Data; verving Alastair Dunning, lid van de LCRDM werkgroep Onderzoeksondersteuning en Advies) presenteerde een onderzoek waarin gekeken werd hoe verschillende repositories scoorden op de FAIR principes. Er blijken verschillen te zijn tussen discipline-specifieke repositories: in sommige disciplines wordt uitgebreide metadata gebruikt, terwijl in andere discipline-specifieke repositories gestructureerde metadata ontbreekt. Ook zagen de onderzoekers dat sommige principes erg specifiek geformuleerd zijn en dus makkelijk meetbaar waren, terwijl andere principes erg breed geformuleerd zijn, wat meetbaarheid bemoeilijkt. De onderzoekers geven aan dat er enkele snelle stappen te maken zijn om datasets meer FAIR te maken, zoals het toewijzen van een DOI en gebruikerslicentie, en het toevoegen van gestructureerde metadata. Andere verbeterpunten, zoals het toevoegen van informatie over de herkomst van datasets en het ontwikkelen van community standaarden, zullen meer tijd kosten.

 Jasmin Boehmer - How to be FAIR.pdf


Marjan Grootveld (DANS, tevens lid van de LCRDM Werkgroep Onderzoeksondersteuning)
presenteerde de FAIR metrics om datasets te beoordelen op basis van de FAIR principes. Een dataset wordt met behulp van deze metrics beoordeeld op de mate van F, A, en I. De combinatie van deze drie scores resulteert in een score voor R. Het uitgangspunt bij het ontwikkelen van deze tool was de vraag of de FAIR principes voor data gecombineerd kunnen worden met 'Data Seal of Approval' richtlijnen voor repositories: FAIR data in een Trustworthy Data Repository. Er zijn duidelijke overeenkomsten tussen deze richtlijnen, dus dit lijkt goed mogelijk.

Op dit moment is een pilot van de FAIRdat tool beschikbaar in de vorm van een webformulier. Bekeken moet worden in hoeverre scoring geautomatiseerd kan worden, omdat begrippen als “rich metadata" en “relevant attributes" subjectief en discipline-afhankelijk zijn. Met behulp van de tool kan de 'FAIRness' van een dataset bepaald worden, en bijvoorbeeld weergegeven worden door een FAIR badge bij de dataset in een repository.

Marjan Grootveld - FAIR Metrics.pdf 


Luiz Bonino (DTL, tevens lid van de LCRDM Werkgroep Onderzoeksondersteuning)
gaf een presentatie waarin hij de globale uptake van de FAIR principes besprak. Uit de FAIR principes is snel een globale beweging ontstaan. De FAIR principes worden onder andere gebruikt door de NIH in de VS, en met de ambitie van de European Open Science Cloud (EOSC) onderneemt de EU nu ook actie. Het GO FAIR initiatief is opgericht om de globale verspreiding van de FAIR principes te ondersteunen. Verschillende tools zijn in ontwikkeling om data meer FAIR te maken, zoals de Data Stewardship Wizard en de FAIRifier. Door middel van workshops en hackathons worden onderzoekers geïnformeerd over het FAIR maken van data.

Luiz benadrukte dat de FAIR principes geen standaarden zijn. Sommige principes betreffen data, anderen metadata, en weer anderen zijn gerelateerd aan infrastructuur.

'FAIRness' moet niet gezien worden als een binaire staat, maar als een spectrum: er zijn verschillende niveaus van FAIRness te beschrijven. Er wordt momenteel gewerkt aan concrete en precieze metrics voor elk FAIR principe.

 Luiz Bonino - FAIR Data - GO FAIR.pptx


Tessa Pronk (UU & UKB)
beschreef hordes voor hergebruik van onderzoeksdata. Hergebruik is een belangrijk doel van het delen van onderzoeksdata, en daarom ook een belangrijk doel van de FAIR principes. In het onderzoek dat Tessa presenteerde werd hergebruik benaderd vanuit de gebruiker. Het 3SA model (Share, Search, Select, Appraise, Assess, Adapt) werd besproken, en verschillende uitdagingen bij het hergebruiken van data werden benoemd. Zo weten onderzoekers soms niet dat het nuttig is naar data te zoeken ('Search'). Een veelheid aan plekken of beperkte zoekfunctionaliteit kan het moeilijk maken voor onderzoekers om geschikte datasets te selecteren ('Select'). Gebrekkige metadata zorgt voor een lastige interpretatie van de relevantie van de dataset ('Appraise'). En de data zelf moet ook beoordeeld kunnen worden ('Assess'). Als een relevante dataset gevonden is, kan het voorkomen dat de data incompleet is, of nog opgeschoond moet worden ('Adapt'). Door hergebruik te benaderen vanuit de onderzoeker met behulp van het 3SA model kunnen hordes voor hergebruik weggenomen worden.

 Tessa Pronk - Hordes voor hergebruik.pptx


Na de presentaties volgde een discussie over de ambitie voor een consistent systeem voor het FAIR ontsluiten van onderzoeksdata. Deze discussie vond plaats in kleinere groepen, waarna plenair teruggekoppeld werd. Naar aanleiding van deze discussie is een document opgesteld dat als input kan dienen voor de coalitie die het beleidskader NPOS ambitie 3.2.1 zal gaan schrijven.

Nationaal Plan Open Science.png


Work session FAIR data – UKB & LCRDM – 22 June 2017 

On the 22 June 2017 the Landelijk Coördinatiepunt Research Data Management (LCRDM) (National Coordination Point for Research Data Management) together with the UKB Research Data Work Group (UKBwg RD), organized a work session about FAIR data. The goal of this session was to generate input for, and determine the position of ambition 3.2.1, an  aspect of the National Plan for Open Science (NPOS) - specifically from the perspective of research support staff. NPOS-ambition 3.2.1 falls under the headline 2.1, which aims to make research data optimally suitable for re-use. It’s goal is to build a consistent system for the FAIR unlocking of research data. The LCRDM underwrites this ambition as a supporting stake holder. The session was attended by colleagues who are members of the UKB Research Data Work Group or one of the LCRDM work groups. Some had a dual function and during the introduction highlighted the FAIR activities being undertaken at their respective institutes. A representative from the universities for applied sciences was also present. 

FAIR data principles.jpg
CC-BY-SA-4.0 Sangya Pundir

During the first part of the meeting, that consisted of short presentations, five speakers shed light on the various aspects of FAIR data. 

Marcel Ras (NCDD, also a member of the LCRDM Financial Aspects Work Group) discussed sustainable data in the heritage sector. The concept 'FAIR' is not used in this field. However, in the heritage sector it is important that data is visible (F, A), usable (I, R), and sustainable (R). In the sector one speaks of sustainable access. The Digital Heritage Network drew up a “national strategy for digital heritage” in 2014. This strategy defines the framework for a broad collaboration aimed at ensuring that the Dutch digital collection is conspicuous for end users. Better interconnection must improve integral visibility of the collection and make sure it remains accessible in the long-term. Increasingly more collections in the heritage sector are digitally accessible but the different infrastructures that make them visible still need to be linked. To flesh out this national strategy, three work programmes have been initiated to pursue projects aimed at realizing collective facilities. These work programmes are being realized by the Network for Digital Heritage (NDE).

The National Coalition for Digital Sustainability (NCDD) has taken major steps to realize a broader and domain-transcending collaborative venture to promote sustainable access. As part of the Network for Digital Heritage, the NCDD is responsible for the Sustainable Digital Heritage work programme that has drafted a catalogue of sustainable facilities, set up a Wiki that lists elements for sustainability policy, created a digital learning environment and drawn up a model for costs.

Jasmin Böhmer (TU Delft & 4TU Centre for Research Data; replacing Alastair Dunning, member of the LCRDM work group for Research Support and Advice) presented a research project that investigated how different repositories score according to FAIR principles. It transpires that there are differences between discipline-specific repositories: in some disciplines, extensive metadata are used while in other discipline-specific depositories, structured metadata is lacking. Researchers also noticed that some principles are very specifically formulated and therefore easy to evaluate, while other principles were broadly formulated, which complicates a fluent assessment. Researchers indicated that several rapid steps can be taken to make datasets more FAIR, i.e. assigning a DOI and a user’s license and adding structured metadata. Other points for improvement, like supplementary information about the origins of datasets and developing community standards, will cost more time. 

Marjan Grootveld (DANS, also a member of the LCRDM Research Support Work Group) presented FAIR metrics to help evaluate datasets on the basis of FAIR principles. With the aid of these metrics a dataset’s level of F, A, and I can be assessed. The combination of these three ratings results in a score for R. The object of developing this tool was to see if FAIR principles for data could be combined with the 'Data Seal of Approval' guidelines for repositories: FAIR data in a Trustworthy Data Repository. This seems to be a viable goal because there are clear similarities between the different guidelines. 
Currently there is a pilot of the FAIRdat tool available in web form. It should be investigated to what extent scoring can be automated because concepts like “rich metadata" and “relevant attributes" are subjective and discipline-dependent. With the use of the tool the ‘FAIRness’ of a dataset can be determined and denoted, for example by marking a dataset with a FAIR badge in a repository.

Luiz Bonino (DTL, also a member of the LCRDM Research Support Work Group) gave a presentation in which he discussed the global acceptance of FAIR principles. FAIR principles have rapidly spawned a global movement and are applied, among others, by the NIH in the U.S. The ambitions that gave rise to the European Open Science Cloud (EOSC) have also spurred the EU to take action. The GO FAIR initiative has been set up to support the global distribution of FAIR principles. Various tools are being developed to make data more FAIR, like the Data Stewardship Wizard and the FAIRifier. Through workshops and hackathons researchers are informed how they can make data FAIR.  

Luiz emphasizes that the FAIR principles do not qualify as standards. Some principles relate to data, others to metadata, and yet others are concerned with infrastructure.

'FAIRness' must not be seen as a binary state, but as a spectrum: there are different levels of FAIRNESS that can be described. Currently experts are working on concrete and precise metrics for every FAIR principle.  

Tessa Pronk (UU & UKB) described the obstacles one can encounter when re-using research data. Re-use is important for the sharing of research data and therefore also essential for FAIR principles. Tessa’s investigation approached re-use from the perspective of the user. The 3SA model (Share, Search, Select, Appraise, Assess, Adapt) was discussed and different challenges concerning the re-use of data were identified. For example, researchers are sometimes unaware that searching for data can also be fruitful. ('Search'). A multitude of sites or limited search functionality can make it difficult for researchers to select suitable datasets ('Select'). Deficient metadata can make it awkward to determine the relevance of a dataset ('Appraise'). And the data in question also needs to be evaluated ('Assess'). When a relevant dataset has been found, data may be incomplete or need to be decontaminated ('Adapt'). For a researcher, use of a 3SA model when re-using data, can help remove obstacles.  

The presentations were followed by a discussion about ambitions for a consistent system that allows FAIR access to research data. The discussion took place in small groups after which everyone convened to give feedback. On the basis of this debate, a document was drawn up that can serve as input for the coalition assigned to write a NPOS ambition 3.2.1 policy framework. 


Comments

There are no comments for this post.

 Blog Tools