Commit 6fef9a8f authored by Roelofsen, Hans's avatar Roelofsen, Hans
Browse files

Data Management presentation

parent f6b5d2ab
---
# Data Management in team B&B
###_wat is 't en wat moeten we ermee?_
---
door: Hans Roelofsen
datum: 31 mei 20201
---
## Data mangement?
> _"Looking after you data to help your future self and your peers find, open, understand and reuse data"_
> Shauna Ni Fhlaithearta
![figuur 1](images/DM1b.jpg "Data management yeah!")
Data management is een investering in het heden om het jezelf en je collegas in de toekomst makkelijker te maken.
---
### Wat bedoelen we met _data_?
> _"een unieke verzameling gegevens die bewust en doelmatig verzameld, gecreeerd of ontworpen zijn en betrekking hebben op ons werkveld"_
> eigen definitie
#### Bijvoorbeeld:
* vegetatieopname
* veldwaarnemingen
* meetgegevens
* interview-geluidsopname
* enquête responsies
* GIS kaarten
* Tabellen
#### Maar niet (altijd):
* rapportages & publicaties
* tussen-producten
* Powerpoints
* figuren
* posters
#### Verschillende smaken data
* externe data-providers ([CBS](https://opendata.cbs.nl/statline/), [NGR](https://www.nationaalgeoregister.nl/geonetwork/srv/dut/catalog.search#/home))
* project-partners (PBL, SBB, etc)
* intern
* tijdelijk/probeersels
* tussenproducten
* data van eerdere projecten
* data van collega projecten
* project-eindresultaat
---
### Project Data Cyclus
![Cyclus](images/dm2.jpg)
Simpel gezegd: een project verzameld en analyseert data, wat resulteert in publicaties en een of meerdere `Project-Resultaat` datasets (dwz _datasets die opgeleverd worden door het project, die behouden moeten worden voor toekomstige referentie of gebruik_).
Goed uitgevoerd data-management garandeert dat:
1. de resultaten uit het rapport gereproduceerd kunnen worden
2. de project-data kunnen gebruikt worden in een toekomstig project.
---
### 1. Data vinden
![Sherlock](images/dm3c.jpg)
Om data te kunnen vinden moet het goed opgeslagen zijn.
```
goed opgeslagen data == vindbaar
vindbare data == goed opgeslagen
```
Wat zijn geschkte locaties voor data-opslag voor een lopend WEnR project?
* project-directory op `W:\projects`
* toegankelijk binnen WUR netwerk
* aanvragen bij Servicedesk-IT
* niet gratis, wel veilig
* geschikt voor _grote_ bestanden
* bijvoorbeeld:
* `W:/projects/QMAR`
* `W:/projects/nvk_bdb`
* `W:/projects/doren2019`
* MS OneDrive
* standaard bij WUR account
* persoonsgebonden, maar deelbaar met collegas
* ook buiten WUR netwerk
* ook offline beschikbaar (sync zodra je online bent)
* lokaal (`C:\\`)
* voor lokale werkzaamheden, probeersels, tussenproducten
* niet deelbaar, niet toegankelijk
* partner oplossingen
* Provincie Zeeland Fileshare
* anders?
Wat zijn geschikte locaties voor langdurige opslag van `Project-Resultaat` datasets?
* Wederom `W:\\`
* externe HardDisk (wel goed opbergen)
* papier, ordner (formulieren, metingen etc)
* [4TU Data Archief](https://data.4tu.nl/info/)
* bij project-partners
* Domeinspecifiek:
* SynBioSys (Vegetatieopnamen)
* GeoDesk (GIS kaarten)
* anders
_Maar altijd!_
* Organiseer data op een logische manier:
* chronologisch
* herkomst
* geografisch
* thematisch
* alfabetisch
* losse bestanden alleen in laagste folder-niveau
* forceer de volgorde van directories in file-system mbv prefixes
![Tree](images/dm4.jpg)
* Goede datasets zijn:
* **compleet**
* **intern homogeen**
* **correct**
---
### 2. Data begrijpen
![bright light](images/dm5.jpg)
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment