Op weg naar open data
Op vrijdag 11 oktober kregen de ontwikkelingen in de wetenschap naar ‘meer interdisciplinair’ en ‘meer internationaal’ voor mij concrete invulling, en wel tijdens het kick-off symposium van het onderzoeksproject waarin de hersenontwikkeling van kinderen van kinderen word bestudeerd.
Ik ontmoette daar psychologen, biologen en statistici van over de hele wereld. Dat onderzoek zich ook in toenemende mate richt op internationale vraagstukken, werd duidelijk toen één van de sprekers een laatste bedank-sheet toonde met daarop in onleesbaar kleine letters de honderden medewerkers aan het door hem gepresenteerde onderzoek. Dit is het tijdperk waarin 500 auteurs van een wetenschappelijk artikel geen ongewoon verschijnsel meer is.
Volgens de initiatiefnemers van Science in Transition is in de jaren ‘60 van de vorige eeuw al voorspeld dat institutionalisering en internationalisering en daarmee de grootschaligheid van onderzoek, op termijn zou leiden tot een ware vloedgolf van publicaties en onderzoeksgegevens (van een tsunami is toen vast niet gesproken).
Toch lijkt de aandacht voor het omgaan met deze ‘overvloed’ en de impact ervan vrij recent. Méér publicaties die alsmaar méér collectiebudget opeisen, de discussie over het vrij toegankelijk maken van onderzoeksresultaten, de verantwoording van wetenschappelijke onderzoeksgegevens naar aanleiding van fraudegevallen, het zijn actuele onderwerpen waarover we bijna wekelijks bericht worden via de media.
Ook binnen het wetenschapsbedrijf zijn mechanismen rond wetenschappelijke integriteit en gedragscodes van onderzoekers actuele onderwerpen. In de discussies hierover krijgen onderzoeksgegevens een belangrijke rol. De paragraaf ‘Controleerbaarheid’ in de Gedragscode Wetenschapsbeoefening (VSNU, 2012) gaat zelfs alleen maar over data en bronnen. Bewaking van de kwaliteit van de verzameling, invoer, opslag en verwerking van data wordt als cruciaal gezien.
De KNAW is al langer de pleitbezorger van open toegankelijke data, in de overtuiging dat hiermee een bijdrage geleverd wordt aan de zorgvuldigheid en integriteit van de wetenschapsbeoefening. In het adviesrapport Zorgvuldig en integer omgaan met wetenschappelijke onderzoeksgegevens uit 2012 wordt nader ingegaan op wat er verbeterd kan worden in het omgaan met onderzoeksgegevens. Bevorder de toegankelijkheid van dataverzamelingen, rekening houdend met de verschillen tussen de disciplines en de nog bestaande dilemma’s, is de belangrijkste aanbeveling. Intussen gaan ook onderzoeksfinanciers en –programma’s eisen stellen aan transparantie van onderzoeksgegevens (NWO, Horizon2020). Kortom, er beweegt wel iets, maar we moeten zo langzamerhand ook wel iets!
En wat is er dan nodig?
Niet meer regels natuurlijk, geven alle rapporten aan, maar ‘meer aandacht’. Wat betekent dat bijvoorbeeld voor stappen die de UU kan nemen? Op nummer één staat: communiceren van gedragsregels. Universiteiten om ons heen zijn al bezig met het formuleren van een instellingsbrede beleidsregels over onderzoeksdata. Een kort, helder overzicht van de gedragsregels. Dat kan de UU ook doen. Zou zij moeten doen, op korte termijn, al dan niet in VSNU-verband bijvoorbeeld.
Daarmee ben je er echter nog niet. Zijn de verantwoordelijkheden rondom dataverzamelingen voldoende helder? Is er adequate ondersteuning ingericht voor onderzoekers bij het opzetten van datamanagementplannen, selectie van data, gebruiken van de juiste oplossingen voor opslag, toegang geven, de wijze van beschrijven, juridische aspecten, citeren van andere verzamelingen? Nee, zeker nog niet.
Ook op dit meer praktisch terrein worden discussies gevoerd en zijn al best practices te vinden. Binnen het LERU-samenwerkingsverband van (onderzoeks)universiteiten in Europa wordt door een werkgroep een Roadmap for Research Data voorbereid, die als voorbeeld kan dienen voor de aangesloten universiteiten. De University of Bath heeft al een uitgebreid bewustwordings- en trainingstraject uitgezet.
Als het gaat om technische infrastructuur en dienstverlening, is er ook al veel beschikbaar. Vele onderzoekers in het bètadomein weten ongetwijfeld al heel goed de weg, maar ook voor andere disciplines zijn er voorzieningen als DANS, nu in een samenwerkingsverband met 3TU. Binnen de UU wordt aan een lokaal datacenter gewerkt, en de bibliotheek biedt de dienst Dutch Dataverse aan, waarin onderzoekers onderzoeksdata al tijdens hun onderzoeksproject veilig kunnen opslaan en delen met collega’s op individuele basis (ook van andere instellingen).
Dataverse wordt inmiddels ook binnen andere instellingen (universiteiten, onderzoeksorganisatie) aangeboden, en wordt om die reden waarschijnlijk onder de koepel van Research Data Netherlands gebracht. Het is een succes, mede door de discussie rond wetenschappelijke integriteit. Alleen wordt het nog niet heel massaal gebruikt. Waaruit blijkt dat er nog veel gedaan moet worden aan bewustwording en implementatie van gedragsregels rondom onderzoekgegevens. Het is de hoogste tijd.