De datawasmachine brengt in kaart hoe 'schoon' data zijn en in hoeverre dit met anderen gedeeld kan worden. Dit om studenten zo goed mogelijk te betrekken bij dataprojecten.
Het lectoraat Applied Responsible Artificial Intelligence streeft ernaar studenten zo veel mogelijk te betrekken bij zijn dataprojecten. Echter bevatten de data waarmee gewerkt wordt ook vaak gevoelige aspecten die niet direct met iedereen gedeeld kunnen worden. De datawasmachine probeert hier een oplossing voor de bieden door de data te anonimiseren zodat deze gedeeld mogen worden zonder privacygevoelige of bedrijfskritische aspecten bloot te leggen.
Hoe schoon?
Bij het verwerken van de data is het mogelijk om in te stellen welke data-aspecten gevoelig zijn en dus geanonimiseerd moeten worden en daarnaast is het mogelijk om de mate van anonimisering in te stellen. Per datavraag kan dus afgewogen worden hoe ‘schoon’ deze data van gevoelige informatie dient te zijn ten opzichte van mate van gelijkenis tussen de geanonimiseerde dataset en de originele dataset.