Simulatiedataset voor universiteiten

Aan de slag met de simulatiedataset

Wil je aan de slag met privacygevoelige studentdata? Daarvoor heeft de zone Veilig en betrouwbaar studiedata benutten een simulatiedataset ontwikkeld. De dataset is bedoeld voor universiteiten en bestaat uit synthetische studentdata. Deze data zijn gebaseerd op de echte data van een universiteit, maar zijn dusdanig afgeleid dat je ze niet meer terug kunt herleiden tot echte studenten. Door deze dataset te gebruiken kun je ook buiten je eigen instelling algoritmes en analyses delen zonder dat de privacy van je studenten in het geding komt.

De simulatiedataset geeft je toegang tot:

  • De simulatiedataset die je kunt gebruiken voor uitvoering van onderzoek (een .csv bestand)
  • Een markdownfile dat je kunt gebruiken als bewijsvoering voor kwaliteitsassessment van de gesimuleerde data (een weblink in HTML)
  • De broncode in R die je kunt gebruiken voor het zelf genereren van simulatiedata (in R)

Ontwikkeling dataset en toekomstige simulatiedatasets

De simulatiedataset is ontwikkeld door medewerkers van de Erasmus Universiteit Rotterdam (EUR) en de Vrije Universiteit Amsterdam (VU). Tijdens het verloop van dit project was de privacy van de studenten een belangrijk aandachtspunt.

De dataset voor universiteiten is de eerste stap in een groter traject. In 2021 volgen namelijk twee simulatiedatasets: een voor hogescholen en een voor data uit leermanagementsystemen. Om de simulatiedataset voor hogescholen te bouwen voeren we op dit moment een voorverkenning uit. Daarbij start in 2021 de fase waarin de zone samen met SURF <hyperlink> een simulatiedataset bouwt met data uit leermanagementsystemen. Daarvoor onderzoekt de zone op dit moment of machine learning ingezet kan worden.

Meer informatie

In de PowerPointpresentatie vind je meer informatie over het project en de ontwikkeling van de simulatiedataset. Ook bevat het meer informatie over de borging van privacy in dit gehele project. Wil je kort doorlezen wat de simulatiedataset inhoudt? Bekijk dan de one-pager.

Ga naar de open repository van de simulatiedataset in Bitbucket

Download de Onepager hier 

Download de PowerPointpresentatie hier

Deel deze pagina

Share on facebook
Share on twitter
Share on linkedin
Share on email

Uitgelicht

De volgende projecten, publicaties en producten vind je wellicht ook interessant.
Product
Roadmap Op weg met digitalisering

In de Roadmap Op weg met digitalisering staat een route omschreven met een mogelijke manier om informatie uit arbeidsmarktonderzoek te

Deze website maakt gebruik van cookies. Lees hier over onze Coookies