ݺߣ

ݺߣShare a Scribd company logo
10/30/2020
Datanhallinnan
suunnittelu
Koulutus kouluttajille, osa II
27.10.2020
Mari Elisa Kuusniemi
ORCID: 0000-0002-7675-287X
Tuulitoimisto
2210/30/2020
Koulutuksen sisältö
• Käymme läpi datanhallintasuunnitelman aiheet
• Pohdimme oppimistavoitteita kuhunkin aiheeseen liittyen.
3310/30/2020
Datanhallintasuunnitelman aiheet
• Aineiston yleiskuvaus
• Eettisten periaatteiden ja lainsäädännön
noudattaminen
• Dokumentointi ja metatiedot
• Tallentaminen ja varmuuskopiointi
tutkimushankkeen aikana
• Aineiston avaaminen, julkaiseminen ja arkistointi
tutkimushankkeen päätyttyä
• Aineistonhallintaa koskevat vastuut ja resurssit
Lähde: Tuuli-project. (2020, January 24). General Finnish DMP guidance (Version 2020).
Zenodo. http://doi.org/10.5281/zenodo.3630309
410/30/2020
Storage and
backup
Where to store during
the research project?
Storage and backup during the research
project
• Where will your data be stored, and how will it be backed
up?
• Who will be responsible for controlling access to your data,
and how will secured access be controlled?
6610/30/2020
Kun valitset säilytyspaikkaa
tutkimusdatallesi, pohdi:
• millaista tutkimusaineistoa olet keräämässä ja tuottamassa? Miten
aiot käsitellä sitä? (tutkimusaineiston tyyppi ja määrä saattavat
rajoittaa joidenkin säilytysvaihtoehtojen käyttämistä)
• miten aiot tallentaa, säilyttää, käyttää, varmuuskopioida tai siirtää
tutkimusaineistoasi?
• kenen kanssa aiot jakaa tutkimusaineistosi?
• miten tutkimusaineistoon pääsyä tarvitsee rajoittaa
(pääsynhallinta)?
• aiotko muokata tutkimusaineistoasi tutkimuksen aikana?
• sisältääkö aineistosi sensitiivistä materiaalia? Sisältääkö se
henkilötietoja?
Tekijä
7710/30/2020
Mihin tallentaa?
• PC:n kovalevy
• Ulkoiset kovalevyt
• Muistitikut
• Pilvipalvelut
• Laitoksen/yliopiston serverit, joissa varmuuskopiointi
Tallennusratkaisut
Koulutettavat eivät halua kuulla kaikkien teknisten ratkaisujen
luetteloa. He haluavat tietää, mikä ratkaisu olisi paras ja halvin
juuri heidän omalle datalleen.
Tallennusratkaisuja on paljon ja ne ovat jatkuvassa
muutoksessa. Kuinka pysyn mukana kehityksessä?
Mistä löytää sopiva henkilöä, joka pystyy kansantajuisesti
esittelemään tärkeimmät olemassa olevat ratkaisut ja
vastaamaan yksityiskohtaisiin teknisiin kysymyksiin.
Miten selittää esim. versioivan tallennusratkaisun tai lokia
keräävän tietokannan perusideat, jos koulutettavalla ei ole
ennestään mitään tietoteknistä osaamista?
Koulutettavat eivät saa kiinni tallentamisen eroista tutkimuksen
aikana ja sen jälkeen.
On vaikea päättää millä tasolla tallennusratkaisut pitäisi kuvata
suunnitelmassa. Halutaanko tietää tekniikasta vai riittääkö
periaatetason kuvaus?
1010/30/2020
Opening,
publishing and
archiving
Where the data will go
after the project?
Opening, publishing and archiving the data
after the research project
• What part of the data can be made openly available or
published? Where and when will the data, or its metadata,
be made available?
• Where will data with long-term value be archived, and for
how long?
Repositories and data archives
• Choose a data repository or archive like you choose a journal
where you publish articles.
• Repository or archive should be
• well-established on your research field (or for the data
type).
• curated, if possible (parallel to pear review).
• certificated.
• provide persistent identifiers (like DOI), easy to cite data in
the publication.
• secure archive for sensitive data (certificated, if available).
1310/30/2020
Data
management
responsibilities
and resources
Who is responsible?
How much RDM costs?
Data management responsibilities and
resources
• Who (for example role, position, and institution) will be
responsible for data management (i.e., the data steward)?
• What resources will be required for your data management
procedures to ensure that the data can be opened and
preserved according to FAIR principles (Findable,
Accessible, Interoperable, Re-usable)?
Tasks Resources
Data management planning 1 week
Agreements (consortium, transfer of rights) 2-4 weeks
Data privacy (GDPR) administration 2-4 weeks
Data documentation and cleaning 1-2 hour/week/person
( ~5% of the project FTE)
Data publishing (include checking the
anonymization)
1-2 week(s)/data set
(8 main data sets)
Storage space for sensitive data 10 TB = 2 000€/year
Archiving and deleting data 1-2 week(s)/data set
(5 unpublished data sets)
Expert help for data management, preservation and sharing tasks is provided by
University of Helsinki Data Support
DMP, 2019
10/30/2020
Keskity olennaiseen!
Miksi ihmeessä pitäisi oppia
tekemään
datanhallintasuunnitelma?
Alkuperäinen kuva: Tyyne Savia Museovirasto
Oppimistavoitteet
10/30/2020 18
Opintojen
alussa
Perusopinnot
Jatko-
opiskelijat
Väitelleet
(Post Doc)
Senioritutkijat
191910/30/2020
Group work
• Random small groups in breakout rooms (click to join the
group)
• Working time: about 15 min
Tekijä
202010/30/2020
Task: Learning objectives
• One topic/group.
• Your group number tells you, which learning objective you
work with (you see the number when you join the group)
• Write the answer to the google doc:
http://bit.ly/DMPlearningobjectives
• Each group will present the duscussion and findings to all,
after the group work
Tekijä
2110/30/2020
Kiitos!
Mari Elisa ”Mek” Kuusniemi
mari.elisa.kuusniemi@helsinki.fi

More Related Content

Datanhallinnan suunnittelu - Koulutus kouluttajille, osa II

  • 1. 10/30/2020 Datanhallinnan suunnittelu Koulutus kouluttajille, osa II 27.10.2020 Mari Elisa Kuusniemi ORCID: 0000-0002-7675-287X Tuulitoimisto
  • 2. 2210/30/2020 Koulutuksen sisältö • Käymme läpi datanhallintasuunnitelman aiheet • Pohdimme oppimistavoitteita kuhunkin aiheeseen liittyen.
  • 3. 3310/30/2020 Datanhallintasuunnitelman aiheet • Aineiston yleiskuvaus • Eettisten periaatteiden ja lainsäädännön noudattaminen • Dokumentointi ja metatiedot • Tallentaminen ja varmuuskopiointi tutkimushankkeen aikana • Aineiston avaaminen, julkaiseminen ja arkistointi tutkimushankkeen päätyttyä • Aineistonhallintaa koskevat vastuut ja resurssit Lähde: Tuuli-project. (2020, January 24). General Finnish DMP guidance (Version 2020). Zenodo. http://doi.org/10.5281/zenodo.3630309
  • 4. 410/30/2020 Storage and backup Where to store during the research project?
  • 5. Storage and backup during the research project • Where will your data be stored, and how will it be backed up? • Who will be responsible for controlling access to your data, and how will secured access be controlled?
  • 6. 6610/30/2020 Kun valitset säilytyspaikkaa tutkimusdatallesi, pohdi: • millaista tutkimusaineistoa olet keräämässä ja tuottamassa? Miten aiot käsitellä sitä? (tutkimusaineiston tyyppi ja määrä saattavat rajoittaa joidenkin säilytysvaihtoehtojen käyttämistä) • miten aiot tallentaa, säilyttää, käyttää, varmuuskopioida tai siirtää tutkimusaineistoasi? • kenen kanssa aiot jakaa tutkimusaineistosi? • miten tutkimusaineistoon pääsyä tarvitsee rajoittaa (pääsynhallinta)? • aiotko muokata tutkimusaineistoasi tutkimuksen aikana? • sisältääkö aineistosi sensitiivistä materiaalia? Sisältääkö se henkilötietoja? Tekijä
  • 7. 7710/30/2020 Mihin tallentaa? • PC:n kovalevy • Ulkoiset kovalevyt • Muistitikut • Pilvipalvelut • Laitoksen/yliopiston serverit, joissa varmuuskopiointi
  • 9. Koulutettavat eivät halua kuulla kaikkien teknisten ratkaisujen luetteloa. He haluavat tietää, mikä ratkaisu olisi paras ja halvin juuri heidän omalle datalleen. Tallennusratkaisuja on paljon ja ne ovat jatkuvassa muutoksessa. Kuinka pysyn mukana kehityksessä? Mistä löytää sopiva henkilöä, joka pystyy kansantajuisesti esittelemään tärkeimmät olemassa olevat ratkaisut ja vastaamaan yksityiskohtaisiin teknisiin kysymyksiin. Miten selittää esim. versioivan tallennusratkaisun tai lokia keräävän tietokannan perusideat, jos koulutettavalla ei ole ennestään mitään tietoteknistä osaamista? Koulutettavat eivät saa kiinni tallentamisen eroista tutkimuksen aikana ja sen jälkeen. On vaikea päättää millä tasolla tallennusratkaisut pitäisi kuvata suunnitelmassa. Halutaanko tietää tekniikasta vai riittääkö periaatetason kuvaus?
  • 11. Opening, publishing and archiving the data after the research project • What part of the data can be made openly available or published? Where and when will the data, or its metadata, be made available? • Where will data with long-term value be archived, and for how long?
  • 12. Repositories and data archives • Choose a data repository or archive like you choose a journal where you publish articles. • Repository or archive should be • well-established on your research field (or for the data type). • curated, if possible (parallel to pear review). • certificated. • provide persistent identifiers (like DOI), easy to cite data in the publication. • secure archive for sensitive data (certificated, if available).
  • 14. Data management responsibilities and resources • Who (for example role, position, and institution) will be responsible for data management (i.e., the data steward)? • What resources will be required for your data management procedures to ensure that the data can be opened and preserved according to FAIR principles (Findable, Accessible, Interoperable, Re-usable)?
  • 15. Tasks Resources Data management planning 1 week Agreements (consortium, transfer of rights) 2-4 weeks Data privacy (GDPR) administration 2-4 weeks Data documentation and cleaning 1-2 hour/week/person ( ~5% of the project FTE) Data publishing (include checking the anonymization) 1-2 week(s)/data set (8 main data sets) Storage space for sensitive data 10 TB = 2 000€/year Archiving and deleting data 1-2 week(s)/data set (5 unpublished data sets) Expert help for data management, preservation and sharing tasks is provided by University of Helsinki Data Support DMP, 2019
  • 17. Miksi ihmeessä pitäisi oppia tekemään datanhallintasuunnitelma? Alkuperäinen kuva: Tyyne Savia Museovirasto
  • 19. 191910/30/2020 Group work • Random small groups in breakout rooms (click to join the group) • Working time: about 15 min Tekijä
  • 20. 202010/30/2020 Task: Learning objectives • One topic/group. • Your group number tells you, which learning objective you work with (you see the number when you join the group) • Write the answer to the google doc: http://bit.ly/DMPlearningobjectives • Each group will present the duscussion and findings to all, after the group work Tekijä
  • 21. 2110/30/2020 Kiitos! Mari Elisa ”Mek” Kuusniemi mari.elisa.kuusniemi@helsinki.fi