ºÝºÝߣ

ºÝºÝߣShare a Scribd company logo
Data management
26 mei 2015
Helen Klip
Deze presentatie is gemaakt met behulp van informatie van verschillende websites:
1. Research data management UvA: http://rdm.uva.nl/
2. http://datasupport.researchdata.nl/over-de-cursus/
3. http://nl.wikipedia.org/wiki/Diederik_Stapel
4. http://www.wanttoknow.nl/hoofdartikelen/wetenschappelijk-onderzoek-toont-
wetenschapsfraude-aan/
5. Research Data Management Plan Radboud:
http://www.ru.nl/library/services/research/researchdata/dmp/
6. http://www.rug.nl/bibliotheek/researchdata/data-management-plan-2.pdf
7. http://www.rug.nl/frw/workshop_-hoe-schrijf-je-een-research-data-management-plan_
Bronnen
Wie heeft er afspraken
gemaakt over
bestandsnamen?
• Hoe zien die bestandsnamen eruit?
5/28/2015www.karakter.com 3
Worden alle gegevens
gearchiveerd?
• Welke gegevens?
• Waarom wel?
• Waarom niet?
5/28/2015www.karakter.com 4
Wie weet er zeker dat
zijn onderzoek
reproduceerbaar is?
• En als je het niet weet, hoe verantwoord
je dit?
5/28/2015www.karakter.com 5
• Wat is Datamanagement
• Waarom Data Management
• Research Data Management plan
• Data Management tijdens onderzoek
• Discussie/vragen
Inhoud
5/28/2015www.karakter.com 6
Datamanagement zorgt ervoor dat alle onderzoeksgegevens op de lange
termijn reproduceerbaar zijn.
Dat wil zeggen onderzoeksgegevens zijn:
• vindbaar
• toegankelijk
• begrijpelijk
Wat is Data Management
5/28/2015www.karakter.com 7
Datamanagement zorgt ervoor dat alle onderzoeksgegevens op de lange
termijn reproduceerbaar zijn.
Dat wil zeggen onderzoeksgegevens zijn:
• vindbaar
• toegankelijk
• begrijpelijk
Wat is Data Management
5/28/2015www.karakter.com 8
1. Financiers en andere partijen stellen eisen tav datamanagement
2. Zorgt voor goede planning
3. Verhoging van de impact van het onderzoek
4. Documenteren vermindert stress
5. Delen versterkt je reputatie
Waarom Data Management
5/28/2015www.karakter.com 9
1. Financiers en andere partijen stellen
eisen
• Er bestaat in Nederland een Gedragscode Wetenschapsbeoefening.
Door te werken met een Data Management Plan voldoet de
onderzoeker aan deze gedragscode.
• Steeds meer onderzoeksfinanciers vragen om een Data Management
Plan. Bijvoorbeeld ZonMW:
http://www.zonmw.nl/fileadmin/documenten/Toegang_Tot_Data__TTD/Achtergrondinformatie_bij_dataparagraaf_en_dataman
agementplan.pdf
5/28/2015www.karakter.com 10
2. Zorgt voor goede planning
• Goed data management zorgt voor een goed verloop van de studie.
5/28/2015www.karakter.com 11
3. Verhoging van de impact van het
onderzoek
• Publicatie en hergebruik van de data vergroot de impact van het
onderzoek.
• Goed datamanagement draagt bij aan de uitstraling en reputatie van
karakter als onderzoeksinstelling.
5/28/2015www.karakter.com 12
4. Documenteren vermindert stress
• Goed documenteren zorgt ervoor dat bestanden vindbaar zijn.
Scheelt een hoop stress!
5/28/2015www.karakter.com 13
5. Delen versterkt je reputatie
• Anderen zijn eenvoudig in staat om de data en de bevindingen te
verifiëren.
• De data kan worden gebruikt om nieuwe onderzoeksvragen te
beantwoorden.
• Delen verkleint de kans op wetenschapsfraude!
5/28/2015www.karakter.com 14
Wetenschapsfraude
5/28/2015www.karakter.com 15
Bron: http://www.nrc.nl/wp-content/uploads/2012/11/wetenschapsfraude.jpg
Wetenschapsfraude
• De Tilburgse hoogleraar
sociale psychologie Diederik
Stapel blijkt op grote schaal te
hebben gefraudeerd met
onderzoeksgegevens (2010).
Bron: http://nl.wikipedia.org/wiki/Diederik_Stapel
5/28/2015www.karakter.com 16
Onjuist omgaan met data - grijs gebied?
(1 van 2)
• Het compleet verzinnen van data.
• Ghostwriting: (biomedische wetenschap). Het raamwerk voor een artikel
wordt geschreven door een externe expert, die niet zelden werkt bij een
farmaceutisch bedrijf dat belang heeft bij de voorgenomen publicatie.
‘Onafhankelijke’ wetenschappers zetten vervolgens hun namen boven het
stuk..!
• Fishing: het lukraak, ongericht zoeken in databestanden naar gegevens. En
als er wat interessants opduikt, dit dan presenteren als een doelbewust
uitgevoerd onderzoek.
Bron: http://www.wanttoknow.nl/hoofdartikelen/wetenschappelijk-onderzoek-toont-wetenschapsfraude-aan/
5/28/2015www.karakter.com 17
Onjuist omgaan met data - grijs gebied?
(2 van 2)
• Knijpen en kneden: gegevens uit datasets zolang bewerken en aanpassen
totdat er ‘iets significants’ uitrolt.
• Strategisch publiceren: een mooi onderzoek opknippen in meerdere
hapklare publicatiebrokjes en deze dan in verschillende wetenschappelijke
bladen publiceren om zoveel mogelijk publicaties te scoren.
• Name dropping: vaak staan er tussen de auteursnamen boven artikelen
namen van wetenschappers die niets of bijna niets aan het artikel hebben
bijgedragen. Vooral hoogleraren willen graag als mede-auteur worden
opgevoerd. Dat scheelt weer in de publicatielijst.
Bron: http://www.wanttoknow.nl/hoofdartikelen/wetenschappelijk-onderzoek-toont-wetenschapsfraude-aan/
5/28/2015www.karakter.com 18
https://www.youtube.com/watch?v=gYDb-GP1CA4&feature=player_embedded
Research Data Management plan (DMP)
5/28/2015www.karakter.com 19
1. Wat staat er in een Data Management plan (DMP)
2. Templates en checklists
Research Data Management plan (DMP)
5/28/2015www.karakter.com 20
1. Wat staat er in een DMP (1 van 2)
De volgende vragen komen aan de orde in een DMP
• Welke data gaat u verzamelen? Wat voor type data of welke
bestandsformaten? Hoeveel?
• Waar en hoe gaat u uw data opslaan? Hoe zorgt u voor back-ups?
• Hoe gaat u uw data organiseren en beschrijven?
• Wie krijgt toegang tot uw data? Wanneer? Hoe gaat u die toegang beheren?
• Welke data worden na afloop van het project gearchiveerd? Waar en voor hoe
lang?
Bron: http://rdm.uva.nl/
5/28/2015www.karakter.com 21
1. Wat staat er in een DMP (2 van 2)
De volgende vragen komen aan de orde in een DMP
• Komen de gearchiveerde data beschikbaar voor anderen? Wanneer? Onder
welke licentie?
• Wie is de eigenaar van uw data? Wie is verantwoordelijk voor het beheer van
uw data?
• (Hoe) is voorzien in de middelen die nodig zijn om dit plan uit te voeren?
Bron: http://rdm.uva.nl/
5/28/2015www.karakter.com 22
2. Templates en checklists
Voor het opstellen van een datamanagementplan zijn verschillende
modellen (templates) en checklists beschikbaar.
Radboud Expert Centre Research Data
http://www.ru.nl/library/services/research/researchdata/dmp/
5/28/2015www.karakter.com 23
Onderzoeksdata zijn waardevol!
Als verzamelde data verloren gaan of onbruikbaar worden, kan het
uiterst kostbaar of zelfs onmogelijk zijn om de data opnieuw te
verwerven.
Goed beheer van onderzoeksdata is een van de belangrijkste taken
van een onderzoeker
Bron: http://rdm.uva.nl/
Data Management tijdens onderzoek
5/28/2015www.karakter.com 24
1. Opslagplaats voor digitale data
2. Organiseren van digitale bestanden
3. Versiebeheer
Data Management tijdens onderzoek
5/28/2015www.karakter.com 25
1. Opslagplaats voor digitale data (1 van 3)
beschikbare ruimte (zo veel mogelijk),
prijs (zo laag mogelijk)
gebruiksgemak (zo groot mogelijk)
Bron: http://rdm.uva.nl/
5/28/2015www.karakter.com 26
1. Opslagplaats voor digitale data (2 van 3)
betrouwbaarheid: kan ik erop vertrouwen dat mijn data niet wegraken en
ik er altijd bij kan?
veiligheid: waar staat de server waarop mijn data opgeslagen zijn precies
en welke wetgeving geldt daar?
exportmogelijkheden: kan ik de data die ik erin stop - bijvoorbeeld in
software voor data-analyse - er ook weer uithalen en in welk
bestandsformaat?
Bron: http://rdm.uva.nl/
5/28/2015www.karakter.com 27
1. Opslagplaats voor digitale data (3 van 3)
• Computer (netwerkschijven)
• Cloud
Vertrouwelijke en gevoelige onderzoeksgegevens NOOIT bij een een publieke cloud-
opslagdienst bewaren.
Als je toch gebruik maakt van een Cloud service altijd een back-up op een andere
plaats aan houden. Daarnaast de bestanden beveiligen met behulp van encryptie
Bron: http://rdm.uva.nl/
5/28/2015www.karakter.com 28
2. Organiseren van digitale bestanden (1 van 3)
Vier tips
• Organiseer de gegevens in logische categorieën/mappen
• Maak bestanden eenvoudig sorteerbaar
• Maak duidelijk onderscheid tussen versies
• Houd bestandsnamen kort en duidelijk
Bron: http://rdm.uva.nl/
5/28/2015www.karakter.com 29
2. Organiseren van digitale bestanden (2 van 3)
• Zorg ervoor dat bestandsnamen consistent benoemd
worden. Gebruik je bijvoorbeeld de datum in de
bestandsnaam, kies dan hoe je de datum noteert
(bijvoorbeeld YYYYMMDD of yymmdd).
• Plaats geen rare karakters zoals ?!@*%{[<> in de
bestandsnaam.
Bron: http://datasupport.researchdata.nl/over-de-cursus/
5/28/2015www.karakter.com 30
2. Organiseren van digitale bestanden (3 van 3)
• Geef herleidbare bestandsnamen, zoals
Project_Instrument_locatie_YYYYMMDD.ext.
• Zorg ervoor dat elk bestand maar één keer in de
folderstructuur voorkomt. Als je een bestand op meerdere
plekken opslaat en je gaat één van beiden bewerken, dan
kunnen er ongewild meerdere versies van hetzelfde
bestand ontstaan.
Bron: http://datasupport.researchdata.nl/over-de-cursus/
5/28/2015www.karakter.com 31
3. Versiebeheer – WEES CONSEQUENT
Verschillende versies van bestanden onderscheiden door middel van een versienummer in de
bestandsnaam, voorafgegaan door een kleine v.
Bijvoorbeeld:
ADHD_IQ_20150422_v1
Meelezers kunnen vervolgens hun initialen erachter plakken
ADHD_IQ_20150422_v1_HK
Volgende versie wordt dan:
ADHD_IQ_20150525_v2
Maak ook altijd een definitieve versie en zet deze in een aparte map!
ADHD_IQ_20150615_DEFINITIEF
5/28/2015www.karakter.com 32
Welke acties ga je nu
ondernemen na
aanleiding van deze
presentatie?
5/28/2015www.karakter.com 33
Hartelijk
Dank voor uw
aandacht
5/28/2015www.karakter.com 34

More Related Content

Datamanagement - Helen klip

  • 1. Data management 26 mei 2015 Helen Klip
  • 2. Deze presentatie is gemaakt met behulp van informatie van verschillende websites: 1. Research data management UvA: http://rdm.uva.nl/ 2. http://datasupport.researchdata.nl/over-de-cursus/ 3. http://nl.wikipedia.org/wiki/Diederik_Stapel 4. http://www.wanttoknow.nl/hoofdartikelen/wetenschappelijk-onderzoek-toont- wetenschapsfraude-aan/ 5. Research Data Management Plan Radboud: http://www.ru.nl/library/services/research/researchdata/dmp/ 6. http://www.rug.nl/bibliotheek/researchdata/data-management-plan-2.pdf 7. http://www.rug.nl/frw/workshop_-hoe-schrijf-je-een-research-data-management-plan_ Bronnen
  • 3. Wie heeft er afspraken gemaakt over bestandsnamen? • Hoe zien die bestandsnamen eruit? 5/28/2015www.karakter.com 3
  • 4. Worden alle gegevens gearchiveerd? • Welke gegevens? • Waarom wel? • Waarom niet? 5/28/2015www.karakter.com 4
  • 5. Wie weet er zeker dat zijn onderzoek reproduceerbaar is? • En als je het niet weet, hoe verantwoord je dit? 5/28/2015www.karakter.com 5
  • 6. • Wat is Datamanagement • Waarom Data Management • Research Data Management plan • Data Management tijdens onderzoek • Discussie/vragen Inhoud 5/28/2015www.karakter.com 6
  • 7. Datamanagement zorgt ervoor dat alle onderzoeksgegevens op de lange termijn reproduceerbaar zijn. Dat wil zeggen onderzoeksgegevens zijn: • vindbaar • toegankelijk • begrijpelijk Wat is Data Management 5/28/2015www.karakter.com 7
  • 8. Datamanagement zorgt ervoor dat alle onderzoeksgegevens op de lange termijn reproduceerbaar zijn. Dat wil zeggen onderzoeksgegevens zijn: • vindbaar • toegankelijk • begrijpelijk Wat is Data Management 5/28/2015www.karakter.com 8
  • 9. 1. Financiers en andere partijen stellen eisen tav datamanagement 2. Zorgt voor goede planning 3. Verhoging van de impact van het onderzoek 4. Documenteren vermindert stress 5. Delen versterkt je reputatie Waarom Data Management 5/28/2015www.karakter.com 9
  • 10. 1. Financiers en andere partijen stellen eisen • Er bestaat in Nederland een Gedragscode Wetenschapsbeoefening. Door te werken met een Data Management Plan voldoet de onderzoeker aan deze gedragscode. • Steeds meer onderzoeksfinanciers vragen om een Data Management Plan. Bijvoorbeeld ZonMW: http://www.zonmw.nl/fileadmin/documenten/Toegang_Tot_Data__TTD/Achtergrondinformatie_bij_dataparagraaf_en_dataman agementplan.pdf 5/28/2015www.karakter.com 10
  • 11. 2. Zorgt voor goede planning • Goed data management zorgt voor een goed verloop van de studie. 5/28/2015www.karakter.com 11
  • 12. 3. Verhoging van de impact van het onderzoek • Publicatie en hergebruik van de data vergroot de impact van het onderzoek. • Goed datamanagement draagt bij aan de uitstraling en reputatie van karakter als onderzoeksinstelling. 5/28/2015www.karakter.com 12
  • 13. 4. Documenteren vermindert stress • Goed documenteren zorgt ervoor dat bestanden vindbaar zijn. Scheelt een hoop stress! 5/28/2015www.karakter.com 13
  • 14. 5. Delen versterkt je reputatie • Anderen zijn eenvoudig in staat om de data en de bevindingen te verifiëren. • De data kan worden gebruikt om nieuwe onderzoeksvragen te beantwoorden. • Delen verkleint de kans op wetenschapsfraude! 5/28/2015www.karakter.com 14
  • 16. Wetenschapsfraude • De Tilburgse hoogleraar sociale psychologie Diederik Stapel blijkt op grote schaal te hebben gefraudeerd met onderzoeksgegevens (2010). Bron: http://nl.wikipedia.org/wiki/Diederik_Stapel 5/28/2015www.karakter.com 16
  • 17. Onjuist omgaan met data - grijs gebied? (1 van 2) • Het compleet verzinnen van data. • Ghostwriting: (biomedische wetenschap). Het raamwerk voor een artikel wordt geschreven door een externe expert, die niet zelden werkt bij een farmaceutisch bedrijf dat belang heeft bij de voorgenomen publicatie. ‘Onafhankelijke’ wetenschappers zetten vervolgens hun namen boven het stuk..! • Fishing: het lukraak, ongericht zoeken in databestanden naar gegevens. En als er wat interessants opduikt, dit dan presenteren als een doelbewust uitgevoerd onderzoek. Bron: http://www.wanttoknow.nl/hoofdartikelen/wetenschappelijk-onderzoek-toont-wetenschapsfraude-aan/ 5/28/2015www.karakter.com 17
  • 18. Onjuist omgaan met data - grijs gebied? (2 van 2) • Knijpen en kneden: gegevens uit datasets zolang bewerken en aanpassen totdat er ‘iets significants’ uitrolt. • Strategisch publiceren: een mooi onderzoek opknippen in meerdere hapklare publicatiebrokjes en deze dan in verschillende wetenschappelijke bladen publiceren om zoveel mogelijk publicaties te scoren. • Name dropping: vaak staan er tussen de auteursnamen boven artikelen namen van wetenschappers die niets of bijna niets aan het artikel hebben bijgedragen. Vooral hoogleraren willen graag als mede-auteur worden opgevoerd. Dat scheelt weer in de publicatielijst. Bron: http://www.wanttoknow.nl/hoofdartikelen/wetenschappelijk-onderzoek-toont-wetenschapsfraude-aan/ 5/28/2015www.karakter.com 18
  • 20. 1. Wat staat er in een Data Management plan (DMP) 2. Templates en checklists Research Data Management plan (DMP) 5/28/2015www.karakter.com 20
  • 21. 1. Wat staat er in een DMP (1 van 2) De volgende vragen komen aan de orde in een DMP • Welke data gaat u verzamelen? Wat voor type data of welke bestandsformaten? Hoeveel? • Waar en hoe gaat u uw data opslaan? Hoe zorgt u voor back-ups? • Hoe gaat u uw data organiseren en beschrijven? • Wie krijgt toegang tot uw data? Wanneer? Hoe gaat u die toegang beheren? • Welke data worden na afloop van het project gearchiveerd? Waar en voor hoe lang? Bron: http://rdm.uva.nl/ 5/28/2015www.karakter.com 21
  • 22. 1. Wat staat er in een DMP (2 van 2) De volgende vragen komen aan de orde in een DMP • Komen de gearchiveerde data beschikbaar voor anderen? Wanneer? Onder welke licentie? • Wie is de eigenaar van uw data? Wie is verantwoordelijk voor het beheer van uw data? • (Hoe) is voorzien in de middelen die nodig zijn om dit plan uit te voeren? Bron: http://rdm.uva.nl/ 5/28/2015www.karakter.com 22
  • 23. 2. Templates en checklists Voor het opstellen van een datamanagementplan zijn verschillende modellen (templates) en checklists beschikbaar. Radboud Expert Centre Research Data http://www.ru.nl/library/services/research/researchdata/dmp/ 5/28/2015www.karakter.com 23
  • 24. Onderzoeksdata zijn waardevol! Als verzamelde data verloren gaan of onbruikbaar worden, kan het uiterst kostbaar of zelfs onmogelijk zijn om de data opnieuw te verwerven. Goed beheer van onderzoeksdata is een van de belangrijkste taken van een onderzoeker Bron: http://rdm.uva.nl/ Data Management tijdens onderzoek 5/28/2015www.karakter.com 24
  • 25. 1. Opslagplaats voor digitale data 2. Organiseren van digitale bestanden 3. Versiebeheer Data Management tijdens onderzoek 5/28/2015www.karakter.com 25
  • 26. 1. Opslagplaats voor digitale data (1 van 3) beschikbare ruimte (zo veel mogelijk), prijs (zo laag mogelijk) gebruiksgemak (zo groot mogelijk) Bron: http://rdm.uva.nl/ 5/28/2015www.karakter.com 26
  • 27. 1. Opslagplaats voor digitale data (2 van 3) betrouwbaarheid: kan ik erop vertrouwen dat mijn data niet wegraken en ik er altijd bij kan? veiligheid: waar staat de server waarop mijn data opgeslagen zijn precies en welke wetgeving geldt daar? exportmogelijkheden: kan ik de data die ik erin stop - bijvoorbeeld in software voor data-analyse - er ook weer uithalen en in welk bestandsformaat? Bron: http://rdm.uva.nl/ 5/28/2015www.karakter.com 27
  • 28. 1. Opslagplaats voor digitale data (3 van 3) • Computer (netwerkschijven) • Cloud Vertrouwelijke en gevoelige onderzoeksgegevens NOOIT bij een een publieke cloud- opslagdienst bewaren. Als je toch gebruik maakt van een Cloud service altijd een back-up op een andere plaats aan houden. Daarnaast de bestanden beveiligen met behulp van encryptie Bron: http://rdm.uva.nl/ 5/28/2015www.karakter.com 28
  • 29. 2. Organiseren van digitale bestanden (1 van 3) Vier tips • Organiseer de gegevens in logische categorieën/mappen • Maak bestanden eenvoudig sorteerbaar • Maak duidelijk onderscheid tussen versies • Houd bestandsnamen kort en duidelijk Bron: http://rdm.uva.nl/ 5/28/2015www.karakter.com 29
  • 30. 2. Organiseren van digitale bestanden (2 van 3) • Zorg ervoor dat bestandsnamen consistent benoemd worden. Gebruik je bijvoorbeeld de datum in de bestandsnaam, kies dan hoe je de datum noteert (bijvoorbeeld YYYYMMDD of yymmdd). • Plaats geen rare karakters zoals ?!@*%{[<> in de bestandsnaam. Bron: http://datasupport.researchdata.nl/over-de-cursus/ 5/28/2015www.karakter.com 30
  • 31. 2. Organiseren van digitale bestanden (3 van 3) • Geef herleidbare bestandsnamen, zoals Project_Instrument_locatie_YYYYMMDD.ext. • Zorg ervoor dat elk bestand maar één keer in de folderstructuur voorkomt. Als je een bestand op meerdere plekken opslaat en je gaat één van beiden bewerken, dan kunnen er ongewild meerdere versies van hetzelfde bestand ontstaan. Bron: http://datasupport.researchdata.nl/over-de-cursus/ 5/28/2015www.karakter.com 31
  • 32. 3. Versiebeheer – WEES CONSEQUENT Verschillende versies van bestanden onderscheiden door middel van een versienummer in de bestandsnaam, voorafgegaan door een kleine v. Bijvoorbeeld: ADHD_IQ_20150422_v1 Meelezers kunnen vervolgens hun initialen erachter plakken ADHD_IQ_20150422_v1_HK Volgende versie wordt dan: ADHD_IQ_20150525_v2 Maak ook altijd een definitieve versie en zet deze in een aparte map! ADHD_IQ_20150615_DEFINITIEF 5/28/2015www.karakter.com 32
  • 33. Welke acties ga je nu ondernemen na aanleiding van deze presentatie? 5/28/2015www.karakter.com 33