Architectuur /   |   21 november 2022

Datagedreven, maar dan wel met beleid aub! #2

Avatar foto Bas Baumann
Data, algoritmen en de relatie met derden

Datagedreven is hot! Datagedreven biedt geweldige kansen! Datagedreven geeft inzichten die tot nu toe onmogelijk waren! Maar er schuilt ook gevaar in datagedreven werken als je iedereen zomaar z’n gang laat gaan!

Tijdens een masterclass opleiding “Datagedreven Beleid” aan de Erasmus Academie heb ik geleerd dat het voor een organisatie bijzonder uitdagend is om goed om te gaan met datagedreven werken. In een reeks van zeven blogs wil ik mijn kijk hierop met jullie delen. In deel-1 zijn technologische, ethische en beheer aspecten aan de orde gekomen. In deel-2 staan we stil bij de verwerking van data tot informatie en welke risico’s daarbij komen kijken.

Van data tot kennis

Hoewel we het over data hebben, is de reikwijdte breder en gaan de mogelijke implicaties verder dan enkel de data zelf. We verzamelen (klant) data, door de data vervolgens te interpreteren maken wij informatie dat weer kan worden omgezet in kennis[1].

Dit begint bij het verzamelen en vastleggen van data. Iedere organisatie moet zorgvuldig toetsen waarvoor welke data verzameld wordt en niet data verzamelen omdat het kan. Er moet een duidelijke en uitlegbare doelbinding zijn. Het gaat daarbij niet alleen om welke data we waarvoor verzamelen, maar ook wat wij met de vergaarde data doen en vooral wat wij met de informatie en kennis doen die wij uit de data verkrijgen.

Algoritmes en risico’s

Om van data informatie of kennis te maken worden algoritmes ingezet. Algoritmes zijn sets van regels en instructies die een computer geautomatiseerd volgt (Algemene Rekenkamer, 2021). Er zijn verschillende typen algoritmes te onderscheiden t.w. eenvoudige algoritmes zoals beslisbomen, complexe algoritmes zoals statistische machine learning modellen en geavanceerde algoritmes zoals neurale netwerken. Verder zijn algoritmes onder te verdelen in soorten die de mens ondersteunen bij besluitvorming en soorten waarbij sprake is van automatische besluitvorming.

Algoritmes worden in beginsel door mensen gemaakt en kunnen daarom fouten bevatten. Naar mate de algoritmes intelligenter worden wordt het risico steeds groter dat inzicht en begrip over wat er gebeurt vervaagd. Met het gebruik van data bestaat het risico dat de data fouten bevatten. Daarnaast kunnen algoritmes uit de verzamelde data ook foute conclusies trekken met de kans op vooroordelen, discriminatie en vooringenomenheid.  Maar ook ‘gewone’ fouten, zaken die simpelweg niet kloppen zorgen ervoor dat verkeerd beleid wordt gemaakt.

Naast het waken over de herkomst, de verzameling, kwaliteit en het gebruik van data moeten we ook zorgen voor een transparante en controleerbare werking van de gebruikte algoritmes.

Veranderende relaties met derden

Met (big) data krijgen we steeds meer inzicht in hoe mensen en organisaties, systemen en processen in elkaar zitten. Daarbij spelen privacy en integriteit een grote rol en brengt de toepassing van die inzichten maatschappelijke, organisatorische en technologische overwegingen met zich mee.

Er zijn echter ook voordelen voor de partij waarover data worden verzameld. Zo kan een organisatie haar diensten beter afstemmen op de behoeften van derden. Ook kunnen aan de hand van de verzamelde gegevens nieuwe diensten geïdentificeerd en ontwikkeld worden waar derden profijt van kunnen hebben. Er zijn dus voordelen voor de organisatie én voor diegenen waarvan de gegevens worden verwerkt. Deze voordelen moeten wel in balans zijn.

Alleen al door data te verzamelen verandert onze relatie met de ‘eigenaar’ van die data. De organisatie moet zich bewust zijn van die verandering en hiervoor maatregelen treffen. Maar niet alleen de relatie met de eigenaar van de data verandert, ook de relatie met andere belanghebbenden (derden) verandert op het moment dat we bepaalde data verzamelen en verwerken. De tabel hieronder geeft inzage in mogelijke veranderende relaties met belanghebbenden.

Belanghebbende Impact
Eigenaar van de data
(personen, bedrijven, instanties, etc.)
Moet helderheid verschaffen over de manier waarop de organisatie met data omgaat, controles en maatregelen toelichten, afstemmen over het gebruik van de gegevens, signaleren en melden van data lekken/verlies van data
Toezichthouders
(vb. Autoriteit Persoonsgegevens)
Inzage wordt geëist in de afspraken en de maatregelen die zijn getroffen, periodieke audits op de data bescherming en algoritmes (biast), melden van data lekken
(Keten)partners
(vb. toeleveranciers, afnemers)
Security & privacy afspraken maken over de omgang met en gebruik van wederzijds gedeelde gegevens, processen inrichten om hierop toezicht te houden
ICT dienstverleners
(vb. Cloud-/hosting partijen, SaaS-leveranciers, etc.)
Afspraken maken over het opslaan van ‘gevoelige’ gegevens, beveiligingseisen opleggen, processen inrichten om hierop toezicht te houden
Publieke organisaties
(vb. Ombudsman, Amnesty International, etc.)
Helderheid verschaffen over de manier waarop de organisatie met gevoelige data omgaat, gehanteerde processen, procedures, controles en maatregelen toelichten
De eigen werknemers en afdelingen Betrekken van werknemers bij data analyses die (de autonomie over) het eigen werk kunnen beïnvloeden, begeleiden werknemers van wie het werk verandert n.a.v. de informatie verkregen uit de data analyses, afdelingen betrekken wanneer de verhoudingen veranderen n.a.v. de data analyses

Om te onderzoeken hoe de relatie met derden kan veranderen wordt in deel-3 van deze serie blogs aan de hand van een casus de gevolgen van het verzamelen en verwerken van data bekeken vanuit maatschappelijke-, organisatorische- en technologische overwegingen.

Take-away “Architectuur & Datagedreven werken”

Zorg dat je in je architectuur naast omgaan met data ook aandacht geeft aan de governance rondom het gebruik van algoritmen. Wie maakt ze? Wie bepaald of ze voldoen aan wet- en regelgeving? Wie controleert ze? Hoe leggen we hierover verantwoording af? Welke data mogen wel en niet gebruikt worden? Wie is eigenaar van de nieuw gecreëerde data?

Vaak zijn deze zaken onderbelicht en is het wachten op foute conclusies, vooroordelen, discriminatie en vooringenomenheid met alle schadelijke gevolgen van dien.

[1] Kennis = (Informatie * (vaardigheden + attitude + ervaring)) – Moody, R. (2022). Big data en beleid – dag 1. Rotterdam : Erasmus Academie.

Bespreek de mogelijkheden
3