​​​​​​​​​

Data Publication Pyramid  

↑ klik op een van de lagen


Het verband tussen de soort data en de wijze waarop deze gepubliceerd kan worden, wordt vaak geïllustreerd door een variant op de DIKW-piraimide te gebruiken (Data → Information → Knowledge → Wisdom). Deze zogenoemde Datapublicatie-pyramide geeft aan dat er verschillende vormen van onderzoeksdata te onderscheiden zijn, in de piramide van onderen naar boven:​

· ruwe data en data sets

· data collecties en gestructureerde databases

· verwerkte data en data representaties

· publicaties met data.


Ruwe data en data sets 

De data in de onderste laag van de piramide blijven vaak ongepubliceerd en zijn daardoor niet vindbaar en herbruikbaar (5). Hierdoor ontstaat het risico dat zij ongemerkt verloren gaan. Het betreft vaak grote hoeveelheden data.


Data collecties en gestructureerde databases 

Met betrekking tot de data collecties en gestructureerde database laag wordt de relatie tussen publicaties gelegd door middel van een citaat en link vanuit de publicatie naar de data. De data wordt beheerd in een daarvoor geschikte repository. Vanuit de publicatie wordt door middel van een referentie een link gelegd naar de data (3). Een datapublicatie is een beschrijving zijn van een dataset en hoe deze hergebruikt kan worden (4). De datapublicatie is een op zichzelf staande publicatie. Het is een middel om wetenschappelijke waardering te geven aan een onderzoeker voor het publiceren van onderzoeksdata.


Verwerkte data en data representaties 

Voor data in de derde laag, aanvullende data met betrekking tot artikelen, is de link tussen de data en de publicatie nog steeds sterk, hoewel het niet altijd duidelijk is wie er verantwoordelijk is voor de preservering van de data en of er voldaan wordt aan criteria met betrekking tot vindbaarheid en herbruikbaarheid. Vanuit de publicatie wordt een directe link gelegd naar de (aanvullende) data (2). De data zijn vanuit de publicatie direct toegankelijk. 


Publicaties met data 

Op de top van de piramide is er een sterke relatie tussen publicaties en data. Een tijdschrift neemt samen met auteurs/onderzoekers de verantwoordelijkheid voor de publicatie, inclusief de geaggregeerde data die in de publicaties is opgenomen en de wijze waarop het gepresenteerd wordt. Het betreft hier data die ingebed is in een publicatie (1).


Onderstaande piramide benadert waarschijnlijk de huidige verhoudingen:

pub_pir_rea.jpg

Het ideaal zou natuurlijk onderstaande piramide zijn:

pub_pir_ide.jpg

Bron van de laatste twee afbeeldingen: 4tu.datacentrum​