Skip to content
Snippets Groups Projects

Data Management in team B&B

door: Hans Roelofsen
datum: 31 mei 20201

Data mangement?

"Looking after you data to help your future self and your peers find, open, understand and reuse data"
Shauna Ni Fhlaithearta

figuur 1

Data management is een investering in het heden om het jezelf en je collegas in de toekomst makkelijker te maken.


Wat bedoelen we met data?

"een unieke verzameling gegevens die bewust en doelmatig verzameld, gecreeerd of ontworpen zijn en betrekking hebben op ons werkveld"
eigen definitie

Bijvoorbeeld:

  • vegetatieopname
  • veldwaarnemingen
  • meetgegevens
  • interview-geluidsopname
  • enquête responsies
  • GIS kaarten
  • Tabellen

Maar niet (altijd):

  • rapportages & publicaties
  • tussen-producten
  • Powerpoints
  • figuren
  • posters

Verschillende smaken data

  • externe data-providers (CBS, NGR)
  • project-partners (PBL, SBB, etc)
  • intern
    • tijdelijk/probeersels
    • tussenproducten
    • data van eerdere projecten
    • data van collega projecten
    • project-eindresultaat

Project Data Cyclus

Cyclus
Simpel gezegd: een project verzameld en analyseert data, wat resulteert in publicaties en een of meerdere Project-Resultaat datasets (dwz datasets die opgeleverd worden door het project, die behouden moeten worden voor toekomstige referentie of gebruik).

Goed uitgevoerd data-management garandeert dat:

  1. de resultaten uit het rapport gereproduceerd kunnen worden
  2. de project-data kunnen gebruikt worden in een toekomstig project.

1. Data vinden

Sherlock
Om data te kunnen vinden moet het goed opgeslagen zijn.

goed opgeslagen data == vindbaar
vindbare data == goed opgeslagen

Wat zijn geschkte locaties voor data-opslag voor een lopend WEnR project?

  • project-directory op W:\projects
    • toegankelijk binnen WUR netwerk
    • aanvragen bij Servicedesk-IT
    • niet gratis, wel veilig
    • geschikt voor grote bestanden
    • bijvoorbeeld:
      • W:/projects/QMAR
      • W:/projects/nvk_bdb
      • W:/projects/doren2019

W request

  • MS OneDrive
    OneDrive
    • standaard bij WUR account
    • persoonsgebonden, maar deelbaar met collegas (ook buiten WUR netwerk)
    • ook offline beschikbaar (sync zodra je online bent
  • MS Sharepoint
    Sharepoint
    • vooral bedoeld voor documenten, minder geschikt voor grote data
    • document-management systeem
    • draait achter Teams
    • Sync met Windows Explorer
  • lokaal (C:\\)
    • voor lokale werkzaamheden, probeersels, tussenproducten
    • niet deelbaar, niet toegankelijk
  • partner oplossingen
    • Provincie Zeeland Fileshare
    • anders?

Wat zijn geschikte locaties voor langdurige opslag van Project-Resultaat datasets?

  • wederom W:\\
  • externe HardDisk (wel goed opbergen)
  • papier, ordner (formulieren, metingen etc)
  • 4TU Data Archief
    4TU
  • bij project-partners
  • domeinspecifiek:
    • SynBioSys (Vegetatieopnamen)
    • GeoDesk (GIS kaarten)
    • anders

Maar altijd!

  • Goede datasets zijn:
    • compleet
    • intern homogeen
    • correct
  • Organiseer data op een logische manier. Bijvoorbeeld:
    • chronologisch
    • herkomst
    • geografisch
    • thematisch
    • alfabetisch
  • losse bestanden alleen in laagste folder-niveau
  • forceer de volgorde van directories in file-system mbv prefixes
    Tree

2. Data begrijpen

bright light
Data moet beschreven worden om begrepen te worden. Metadata is het toverwoord.

Hoe leg ik metadata vast?

  • apart tabblad in Excel
  • los bestandje ReadMe.txt
  • commentaar regels bovenaan tabel, # Tabel gemaakt door HR, dd 20210528
  • e-mail correspondentie
  • MS Office document Properties
    properties

Wat te vermelden?

  • meeteenheden (cm, m, hectare, km2)
  • legendas van kaarten
  • data-schaal (ordinaal, nominaal, interval)
  • afkortingen
  • kolom-namen
  • referentiedata (coordinaten-systeem, NAP)
  • datum-formatting (ISO8601 zegt: YYYY-MM-DD)
  • auteurs + datum
  • gebaseerd op welke data?
  • wanneer gemaakt, wanneer gewijzigd?
  • gemaakt voor welk project?
  • gebruiksbeperkingen (copyright, vertrouwelijheid)

shouting

Voor metadata geldt:

iets > niets
expliciet > impliciet
te veel > te weinig


3. Data gebruiken

Als we nu op onze data passen, maken we het onze toekomstige zelf en collega's gemakkelijker. Dankzij data-management:

  • is onderzoek gebaseerd op betrouwbare, herleidbare data
  • is onderzoek reproduceerbaar
  • kan data meermaals gebruikt worden

I can do science!


Meer weten?