jun 30
Werksessie FAIR data - LCRDM & UKB - 22 juni 2017

Op 22 juni 2017 organiseerde het Landelijk Coördinatiepunt Research Data Management (LCRDM) samen met de UKB werkgroep Research Data (UKBwg RD) een werksessie over FAIR data. Het doel van deze sessie was om input te genereren voor en positie te bepalen met betrekking tot ambitie 3.2.1 in het Nationaal Plan Open Science (NPOS), specifiek vanuit het ondersteunersperspectief. NPOS-ambitie 3.2.1 valt onder hoofdlijn 2.1 - Onderzoeksdata optimaal geschikt maken voor hergebruik. De ambitie is te komen tot een consistent systeem voor het FAIR ontsluiten van onderzoeksdata. Het LCRDM staat bij deze ambitie vermeld als ondersteunende stakeholder. Bij de sessie waren collega's aanwezig die lid zijn van de UKB Werkgroep Research Data of van een van de werkgroepen van het LCRDM. Sommigen hadden een dubbele pet op en belichtten in de introductie de FAIR-activiteiten binnen hun instellingen. Ook was er vertegenwoordiging vanuit de hogescholen aanwezig.

In het eerste deel van de bijeenkomsten belichtten vijf sprekers in korte presentaties verschillende kanten van FAIR data.

 FAIR data principles.jpg
CC-BY-SA-4.0 Sangya Pundir

Marcel Ras (NCDD, tevens lid LCRDM Werkgroep Financiële aspecten) besprak duurzame data in de erfgoedsector. Het begrip 'FAIR' wordt in deze sector niet gebruikt. Wel is het in de erfgoedsector belangrijk dat data zichtbaar (F, A), bruikbaar (I, R), en houdbaar (R) zijn. In deze sector spreekt men over duurzame toegang. Het Netwerk Digitaal Erfgoed heeft in 2014 een “nationale strategie voor digitaal erfgoed" opgesteld. Deze strategie definieert de kaders voor een brede samenwerking die ervoor moet zorgen dat digitale collectie in Nederland beter zichtbaar gemaakt worden voor eindgebruikers, beter aan elkaar geknoopt worden zodat zichtbaarheid meer integraal wordt en collecties voor de lange termijn toegankelijk blijven. Binnen de erfgoedsector komen steeds meer collecties digitaal beschikbaar, maar de verschillende infrastructuren die deze collecties zichtbaar maken moeten nog meer met elkaar verbonden worden. Om deze nationale strategie handen en voeten te geven zijn er drie werkprogramma's gestart waarbinnen projecten uitgevoerd worden die werken aan gemeenschappelijke voorzieningen. Deze werkprogramma's worden uitgevoerd door het Netwerk Digitaal Erfgoed (NDE).

Er zijn vanuit de Nationale Coalitie Digitale Duurzaamheid (NCDD) flinke stappen gezet naar een bredere en domeinoverstijgende samenwerking om duurzame toegang te bewerkstelligen. De NCDD participeert binnen het Netwerk Digitaal Erfgoed als uitvoerder van het werkprogramma Digitaal Erfgoed Houdbaar. Zo is er een catalogus van duurzaamheidsvoorzieningen ontwikkeld, een Wiki opgezet waarin de elementen van duurzaamheidsbeleid worden weergegeven, een kostenmodel gemaakt, en is er een digitale leeromgeving gerealiseerd.

 Marcel Ras - Digitaal Erfgoed Houdbaar.pptx


Jasmin B
öhmer (TU Delft & 4TU Centre for Research Data; verving Alastair Dunning, lid van de LCRDM werkgroep Onderzoeksondersteuning en Advies) presenteerde een onderzoek waarin gekeken werd hoe verschillende repositories scoorden op de FAIR principes. Er blijken verschillen te zijn tussen discipline-specifieke repositories: in sommige disciplines wordt uitgebreide metadata gebruikt, terwijl in andere discipline-specifieke repositories gestructureerde metadata ontbreekt. Ook zagen de onderzoekers dat sommige principes erg specifiek geformuleerd zijn en dus makkelijk meetbaar waren, terwijl andere principes erg breed geformuleerd zijn, wat meetbaarheid bemoeilijkt. De onderzoekers geven aan dat er enkele snelle stappen te maken zijn om datasets meer FAIR te maken, zoals het toewijzen van een DOI en gebruikerslicentie, en het toevoegen van gestructureerde metadata. Andere verbeterpunten, zoals het toevoegen van informatie over de herkomst van datasets en het ontwikkelen van community standaarden, zullen meer tijd kosten.

 Jasmin Boehmer - How to be FAIR.pdf


Marjan Grootveld (DANS, tevens lid van de LCRDM Werkgroep Onderzoeksondersteuning)
presenteerde de FAIR metrics om datasets te beoordelen op basis van de FAIR principes. Een dataset wordt met behulp van deze metrics beoordeeld op de mate van F, A, en I. De combinatie van deze drie scores resulteert in een score voor R. Het uitgangspunt bij het ontwikkelen van deze tool was de vraag of de FAIR principes voor data gecombineerd kunnen worden met 'Data Seal of Approval' richtlijnen voor repositories: FAIR data in een Trustworthy Data Repository. Er zijn duidelijke overeenkomsten tussen deze richtlijnen, dus dit lijkt goed mogelijk.

Op dit moment is een pilot van de FAIRdat tool beschikbaar in de vorm van een webformulier. Bekeken moet worden in hoeverre scoring geautomatiseerd kan worden, omdat begrippen als “rich metadata" en “relevant attributes" subjectief en discipline-afhankelijk zijn. Met behulp van de tool kan de 'FAIRness' van een dataset bepaald worden, en bijvoorbeeld weergegeven worden door een FAIR badge bij de dataset in een repository.

Marjan Grootveld - FAIR Metrics.pdf 


Luiz Bonino (DTL, tevens lid van de LCRDM Werkgroep Onderzoeksondersteuning)
gaf een presentatie waarin hij de globale uptake van de FAIR principes besprak. Uit de FAIR principes is snel een globale beweging ontstaan. De FAIR principes worden onder andere gebruikt door de NIH in de VS, en met de ambitie van de European Open Science Cloud (EOSC) onderneemt de EU nu ook actie. Het GO FAIR initiatief is opgericht om de globale verspreiding van de FAIR principes te ondersteunen. Verschillende tools zijn in ontwikkeling om data meer FAIR te maken, zoals de Data Stewardship Wizard en de FAIRifier. Door middel van workshops en hackathons worden onderzoekers geïnformeerd over het FAIR maken van data.

Luiz benadrukte dat de FAIR principes geen standaarden zijn. Sommige principes betreffen data, anderen metadata, en weer anderen zijn gerelateerd aan infrastructuur.

'FAIRness' moet niet gezien worden als een binaire staat, maar als een spectrum: er zijn verschillende niveaus van FAIRness te beschrijven. Er wordt momenteel gewerkt aan concrete en precieze metrics voor elk FAIR principe.

 Luiz Bonino - FAIR Data - GO FAIR.pptx


Tessa Pronk (UU & UKB)
beschreef hordes voor hergebruik van onderzoeksdata. Hergebruik is een belangrijk doel van het delen van onderzoeksdata, en daarom ook een belangrijk doel van de FAIR principes. In het onderzoek dat Tessa presenteerde werd hergebruik benaderd vanuit de gebruiker. Het 3SA model (Share, Search, Select, Appraise, Assess, Adapt) werd besproken, en verschillende uitdagingen bij het hergebruiken van data werden benoemd. Zo weten onderzoekers soms niet dat het nuttig is naar data te zoeken ('Search'). Een veelheid aan plekken of beperkte zoekfunctionaliteit kan het moeilijk maken voor onderzoekers om geschikte datasets te selecteren ('Select'). Gebrekkige metadata zorgt voor een lastige interpretatie van de relevantie van de dataset ('Appraise'). En de data zelf moet ook beoordeeld kunnen worden ('Assess'). Als een relevante dataset gevonden is, kan het voorkomen dat de data incompleet is, of nog opgeschoond moet worden ('Adapt'). Door hergebruik te benaderen vanuit de onderzoeker met behulp van het 3SA model kunnen hordes voor hergebruik weggenomen worden.

 Tessa Pronk - Hordes voor hergebruik.pptx


Na de presentaties volgde een discussie over de ambitie voor een consistent systeem voor het FAIR ontsluiten van onderzoeksdata. Deze discussie vond plaats in kleinere groepen, waarna plenair teruggekoppeld werd. Naar aanleiding van deze discussie is een document opgesteld dat als input kan dienen voor de coalitie die het beleidskader NPOS ambitie 3.2.1 zal gaan schrijven.

Nationaal Plan Open Science.png

Comments

There are no comments for this post.

 Blog Tools