Complexe wetten leiden tot fouten die burgers in grote problemen kunnen brengen. De roep om meer maatwerk klinkt dan ook steeds luider: nooit meer een toeslagenaffaire! Maar ook maatwerk kan leiden tot groot individueel onrecht.

Door: Paul de Beer
Redacteur S&D, Hoogleraar arbeidsverhoudingen aan de UvA, verbonden aan AIAS-HSI en directeur van het Wetenschappelijk bureau voor de Vakbeweging.

Recent is de aandacht voor de burger in het overheidsbeleid sterk toegenomen, vooral als uitvloeisel van de toeslagenaffaire.[1] Dit heeft onder meer geleid tot een herontdekking van maatwerk. Dat is op zichzelf begrijpelijk: als de overheid meer oog wil hebben voor de mogelijkheden en beperkingen van burgers – tegenwoordig in navolging van de WRR veelal doenvermogen genoemd – dienen wetten en regelingen meer rekening te houden met verschillen tussen burgers. Maatwerk is daar een voor de hand liggend antwoord op. Maar (meer) maatwerk brengt ook belangrijke risico’s met zich mee, zo zal ik in dit artikel betogen, naar aanleiding van het nieuwe boek Noise (Ruis in Nederlandse vertaling) van Daniel Kahneman, Olivier Sibony en Cass R. Sunstein.[2]

Iedereen die pleit voor meer maatwerk zou dit boek moeten lezen. De auteurs hebben een simpele boodschap met verstrekkende implicaties. Het oordeel van experts bevat veel ruis, waardoor verschillende experts exact hetzelfde geval vaak zeer verschillend beoordelen. Dit betekent dat de beslissing die genomen wordt in een bepaalde zaak, in hoge mate afhankelijk is van wie de zaak behandelt. In hun boek geven de auteurs hiervan talloze voorbeelden. Die variëren van rechters die in identieke gevallen sterk uiteenlopende straffen opleggen (soms variërend van enkele weken tot meerdere jaren gevangenisstraf), via artsen die voor dezelfde patiënt verschillende diagnoses stellen, immigratieambtenaren die asielverzoeken beoordelen en docenten die leerlingen beoordelen tot werkgevers die kandidaten voor een functie selecteren. Steeds weer blijkt er een grote variatie te zijn in de beoordeling van dezelfde persoon of zaak door verschillende beoordelaars.

Omgaan met verschillen tussen burgers
Alvorens verder in te gaan op dit boek, is het goed eerst een helder beeld te hebben hoe de overheid omgaat met verschillen tussen burgers. Daarvoor zijn drie mogelijkheden. De eerste mogelijkheid is dat de overheid deze verschillen negeert. Er zijn vaak goede redenen waarom de overheid bewust geen onderscheid maakt tussen burgers, en wetten en regelingen niet afstemt op verschillen tussen individuen. Zo geldt voor alle kinderen vanaf vijf jaar de leerplicht (ongeacht de intellectuele ontwikkeling van het kind), heeft iedere burger vanaf 18 jaar stemrecht (ongeacht iemands politieke inzicht) en ontvangt iedere ingezetene vanaf de pensioengerechtigde leeftijd een AOW-uitkering (ongeacht of men nog in staat is langer door te werken). Dergelijke uniforme wetten en regels hebben grote voordelen: ze zijn helder en scheppen rechtszekerheid en rechtsgelijkheid, ze zijn relatief eenvoudig uit te voeren en er hoeft geen rekening te worden gehouden met persoonlijke omstandigheden.

De overheid kiest er echter ook veelvuldig voor om wel onderscheid te maken en wetten en regels af te stemmen op de verschillen tussen mensen. De reden hiervoor is meestal dat bepaalde groepen of individuen specifieke problemen hebben die de overheid wil oplossen of verlichten. Toeslagen zijn daar een voorbeeld van. Die zijn bedoeld voor burgers die geconfronteerd worden met min of meer onvermijdelijke kosten die zij niet of moeilijk zelf kunnen dragen. Het gaat bijvoorbeeld om huurkosten, zorgkosten of kosten van kinderopvang. Een toeslag is alleen bedoeld voor iemand die daadwerkelijk dergelijke kosten maakt en een beperkte eigen draagkracht heeft. Evenzo is een bijstandsuitkering – anders dan de AOW-uitkering – alleen bedoeld voor mensen die niet zelf in staat zijn in de kosten van levensonderhoud te voorzien en ook niet een beroep op een partner of een ander kunnen doen.

Er zijn vervolgens twee mogelijkheden om te bepalen wie wel en wie niet in aanmerking komt voor zo’n toeslag of uitkering en hoe hoog die moet zijn. De eerste is dat de wet (of lagere wetgeving) precies voorschrijft aan welke voorwaarden je moet voldoen om aanspraak te maken op een toeslag of uitkering en hoe het bedrag wordt bepaald waarop je aanspraak maakt. Dit is de gangbare werkwijze in onze verzorgingsstaat.

De taak van de ambtenaren van uitvoeringsorganisaties, zoals gemeenten, het UWV en de Belastingdienst, is om die voorwaarden zo zorgvuldig mogelijk zonder aanziens des persoons toe te passen. Helaas kan dit soms gruwelijk misgaan, zoals we sinds de toeslagenaffaire weten. Dit heeft vooral met twee factoren te maken. Enerzijds zijn veel wetten en regels heel complex, juist omdat zij de toekenningsvoorwaarden heel precies omschrijven. Hierdoor kunnen gemakkelijk fouten worden gemaakt bij het aanvragen van een uitkering of een toeslag, maar ook bij het beoordelen van de aanvraag. Op dit probleem heeft de WRR gewezen in zijn rapport Weten is nog geen doen.[3] Anderzijds werken gedifferentieerde regels vaak toch niet rechtvaardig uit, omdat ieder individu nu eenmaal anders is en de regels of voorwaarden dikwijls toch niet goed passen bij de individuele omstandigheden.

Feitelijk vraagt dit om nog meer differentiatie in de wet- en regelgeving, om ook met allerlei bijzondere gevallen rekening te houden. Dat maakt ze echter nog complexer, met navenant meer kans op fouten. In het licht van dit dilemma – grote complexiteit en toch niet voldoende mogelijkheden om met alle verschillen tussen burgers rekening te houden – is het begrijpelijk dat steeds luider de roep klinkt om meer ruimte bieden voor maatwerk.

Dit is de derde mogelijkheid om met verschillen tussen burgers om te gaan. Maatwerk betekent dat de uitvoerende instantie of ambtenaar de ruimte (discretionaire bevoegdheid) krijgt te bepalen welke toeslag of uitkering voor een individuele burger het meest toepasselijk is. Terwijl het onmogelijk is in de wetgeving met alle verschillen in omstandigheden tussen burgers rekening te houden, kunnen uitvoerende ambtenaren wel in ieder individueel geval een andere afweging maken.

Dit is een verleidelijke gedachte, die dan ook op steeds bredere steun kan rekenen. In het eindrapport van de Tijdelijke commissie Uitvoeringsorganisaties, Klem tussen balie en beleid, wordt nadrukkelijk gepleit voor meer maatwerk: ‘Tot slot is het van belang dat wetgeving professionals bij uitvoeringsorganisaties ruimte biedt om maatwerk te leveren, met andere woorden: om ongelijke gevallen ongelijk te behandelen.’[4]

Het kabinet-Rutte III heeft deze gedachte overgenomen. Op 25 juni 2021 kondigde minister Koolmees plannen aan om de publieke dienstverlening te verbeteren, waar maatwerk een belangrijk onderdeel van is: ‘Om publieke dienstverleners in staat te stellen de dienstverlening structureel te verbeteren, is het nodig dat zij de ruimte krijgen, en ook nemen, om maatwerk toe te passen. Zo kunnen zij complexe situaties, waarbij burgers in de knel zijn gekomen, beter oplossen.’[5]

Het kabinet staat hierin zeker niet alleen. Pleidooien voor meer maatwerk zijn de laatste jaren alom te horen. In 2019 pleitte de Nationale ombudsman al voor meer maatwerk bij het invorderen van schulden door de overheid.[6] De voorzitter van de Autoriteit Financiële Markten (AFM) pleitte bij de presentatie van het jaarverslag voor meer maatwerk bij de Belastingdienst in geval van bedrijven met financiële problemen.[7]

Dergelijke pleidooien zijn geenszins nieuw. In 2016 stelde de (toenmalige) vice-president van de Raad van State, Piet-Hein Donner, in een toespraak voor het congres van de vereniging van sociale diensten, Divosa, dat er met de grote decentralisatieoperatie een ‘paradigmawisseling’ in gang is gezet, waarin maatwerk (in zijn woorden: beleid op maat) de plaats inneemt van formele juridische gelijkheid.[8]  Ik citeer hem wat uitvoeriger, omdat hij haarscherp de filosofie achter maatwerk weergeeft: ‘Met de decentralisatie en het concept van beleid op maat is de wetgever overgestapt van “gelijkheid” als dragend rechtsidee bij de invulling van sociale en maatschappelijke zorg, naar “ieder het zijne geven”. Het maken van onderscheid naar behoefte, mogelijkheden en omstandigheden is daarmee de norm van uitvoering geworden. (…) Beleidsregels hebben nog wel een functie als leidraad bij de uitvoering, maar zij kunnen niet meer de dragende rechtvaardiging zijn van een beslissing. Als “ieder het zijne geven” uitgangspunt is, behoeft toepassing van een voor ieder gelijke regeling rechtvaardiging; niet de afwijking daarvan.’

Risico’s van maatwerk
Maatwerk kan worden gezien als een poging om de sterke kanten van de eerste twee manieren om met verschillen tussen burgers om te gaan, te combineren en de zwakke punten te vermijden. Maatwerk maakt relatief simpele en uniforme regels mogelijk, maar schept tegelijkertijd maximale ruimte voor differentiatie tussen burgers bij de uitvoering. De wettelijke regels zullen dan wel zo algemeen en breed (je zou ook kunnen zeggen: vaag) geformuleerd moeten worden dat ze voldoende ruimte bieden aan de uitvoering om eigen keuzes en afwegingen te maken. Dit betekent dat beslissingen over de toekenning van toeslagen en uitkeringen (meer) afhankelijk worden van de beoordeling door individuele uitvoerende medewerkers. En daarmee komen we terug bij het boek van Kahneman c.s.

Dat het oordeel van experts niet zelden een bias bevat - dat wil zeggen naar een bepaalde kant overhelt - is bekend. Dit kan leiden tot benadeling van mensen met bepaalde kenmerken, zoals ouderen, mensen met een andere etnische of culturele achtergrond of mensen met een beperking. Hiervoor is terecht steeds meer aandacht, bijvoorbeeld in de vorm van diversiteitsbeleid. Kahneman c.s. laten zien dat noise of ruis een minstens zo groot probleem is, dat echter veel minder wordt opgemerkt. Als verschillende experts in gelijke gevallen tot verschillende oordelen komen, kan het best zijn dat hun oordeel gemiddeld correct is en geen bias vertoont (dit wordt wel de wisdom of the crowds genoemd). Er kan dan echter nog steeds sprake zijn van zeer ongelijke behandeling van vergelijkbare gevallen en daarmee van groot individueel onrecht.

Als van twee aanvragers die in gelijke omstandigheden verkeren, de één geen toeslag krijgt, terwijl de ander een tweemaal te hoge toeslag krijgt, is het gemiddelde bedrag weliswaar correct, maar is er in beide gevallen sprake van onrecht. Als individuele gevallen ertoe doen – en wanneer is dat niet zo? – dan kan ruis in de beoordeling tot grote willekeur en onrechtvaardigheden leiden. De individuele beoordeling wordt dan in feite een loterij.

Let wel, deze ruis wordt niet veroorzaakt door subtiele verschillen tussen individuele gevallen. Hij komt dus niet voort uit het feit dat ieder individueel geval anders is, zoals Donner benadrukte. Kahneman c.s. rapporteren tal van experimenten waarin verschillende experts die exact dezelfde informatie kregen, niettemin tot sterk uiteenlopende beoordelingen kwamen. Daar komt nog bij dat experts vaak niet consistent zijn over de tijd. Als dezelfde expert met een flinke tussenpoos nogmaals hetzelfde geval krijgt voorgelegd, velt deze vaak niet hetzelfde oordeel. Dat oordeel blijkt soms af te hangen van irrelevante factoren als het tijdstip van de dag, het weer of de stemming van de expert. Als je favoriete voetbalclub net een wedstrijd heeft gewonnen, ben je geneigd tot een milder oordeel.

De consequentie is dat maatwerk haast onvermijdelijk gepaard gaat met een hoge mate van willekeur. Maatwerk betekent dat burgers sterk afhankelijk worden van wie hun aanvraag voor een toeslag of uitkering behandelt – en deels ook nog van diens humeur – of hun aanvraag wordt gehonoreerd en hoe hoog het toegekende bedrag is. Dat er sprake is van willekeur zal echter niet snel worden opgemerkt. Immers, de uitvoerende professional zal veelal een overtuigende argumentatie kunnen geven waarom zij/hij in een specifiek geval een bepaald besluit heeft genomen. Omdat ieder geval anders is, is het voor een burger bijna onmogelijk om aan te tonen dat hij – in vergelijking met anderen – onrechtvaardig is behandeld. En als de wet alleen een globale indicatie geeft van de toekenningsvoorwaarden, zal ook bijna nooit te bewijzen zijn dat de afwijzing van een aanvraag strijdig is met de wet.

Dit probleem kan niet worden ondervangen door de ruimte voor maatwerk aan de uitvoeringsorganisatie, zoals de belastingdienst, de gemeente of het UWV, te bieden in plaats van aan de individuele uitvoerende medewerker. Dit zou het probleem alleen verschuiven. Een uitvoeringsorganisatie die meer ruimte krijgt voor maatwerk, heeft feitelijk dezelfde mogelijkheden als de overheid zoals we hiervoor schetsten. Ze kan zelf gedetailleerde regels opstellen over hoe in individuele gevallen moet worden gehandeld. Dan doen zich dezelfde problemen voor van complexiteit en gebrekkige uitvoerbaarheid. Ze kan simpele en uniforme uitvoeringsregels opstellen, maar dan zullen verschillende gevallen gelijk worden behandeld, hetgeen vaak als onrechtvaardig wordt ervaren. En ze kan de ruimte voor maatwerk delegeren aan de uitvoerende medewerkers zelf, waardoor er onvermijdelijk veel ruis in de beoordelingen zal komen.

Andere oplossingen
Zijn er andere oplossingen? Kahneman c.s. doen verschillende suggesties hoe ruis kan worden verminderd. Allereerst constateren zij dat de ruis varieert tussen beoordelaars. Hoe meer expertise iemand heeft, hoe kleiner in het algemeen de ruis. Meer training en (bij)scholing van beoordelaars, zou de ruis dus kunnen verminderen. Het is echter een illusie dat ruis hiermee volledig zal verdwijnen. Niet alle beoordelaars kunnen top-experts zijn. Er zullen onvermijdelijk ook altijd veel middelmatige beoordelaars zijn.

Een tweede oplossing is om een oordeel niet door één, maar door meerdere deskundigen te laten vellen. Een second opinion dus, maar liefst ook nog een derde of vierde beoordeling. Dan kan geprofiteerd worden van de wisdom of the crowds, aangezien de ruis minder wordt als het gemiddelde wordt genomen van meerdere individuele beoordelingen. Het is dan echter wel essentieel dat die oordelen onafhankelijk van elkaar worden geveld.

Als experts gezamenlijk tot een beoordeling komen, is er een sterke neiging tot conformisme. De eerste persoon die in een overleg een oordeel over een bepaalde kwestie geeft, zet vaak de toon, waardoor de volgende sprekers geneigd zijn dit oordeel te volgen. Dit komt doordat mensen het niet collegiaal vinden om een collega tegen te spreken, of omdat zij überhaupt geen uitgesproken mening hebben en dan geneigd zijn om het oordeel van eerdere sprekers te volgen. Dit betekent bijvoorbeeld dat teambesprekingen van casuïstiek door uitvoerende professionals, zoals klantmanagers bij een gemeente, de ruis juist kunnen uitvergroten in plaats van verminderen.

Daarnaast is het belangrijk dat alle experts over exact dezelfde informatie beschikken. Als bij een beoordeling ook meer subjectieve factoren van belang zijn – bijvoorbeeld of een aanvrager eerlijk of gemotiveerd overkomt – zullen liefst alle experts afzonderlijk met een aanvrager moeten spreken. Dit betekent echter een zware belasting voor de aanvrager, die meerdere keren hetzelfde verhaal moet vertellen, en kan ook veel onbegrip oproepen. Bovendien zullen de uitvoeringskosten van een regeling veel hoger worden als meerdere uitvoerende medewerkers onafhankelijk van elkaar een oordeel moeten vellen op basis van zo volledig mogelijke informatie. Wie meer maatwerk wil, maar willekeur en rechtsongelijkheid wil voorkomen, zal bereid moeten zijn voor de uitvoering aanzienlijk meer middelen vrij te maken.

Algoritmen
Een geheel andere en meer controversiële optie, die de voorkeur heeft van de auteurs van Noise, is beoordelingen door mensen een minder grote rol te laten spelen en meer gebruik te maken van algoritmen. Met een algoritme wordt hier een (computer)programma bedoeld dat tot een beoordeling komt door zeer strikt en consequent de geldende regels toe te passen op de informatie die over een individueel geval beschikbaar is. Het grote voordeel van een algoritme is dat het volledig consistent is en in gelijke gevallen altijd dezelfde beoordeling geeft. Daarmee wordt de ruis volledig geëlimineerd.

Kahneman c.s. erkennen dat algoritmen ook een aantal nadelen hebben, al vinden zij deze uiteindelijk niet opwegen tegen de voordelen. Allereerst kan een algoritme ook een bias hebben als de regels waarop het is gebaseerd systematisch in het nadeel van bepaalde groepen uitpakken. Het risico hierop is het grootst als een algoritme niet alleen gebruikmaakt van formele regels, maar ook van statistische informatie, bijvoorbeeld over het voorkomen van oneigenlijk gebruik of fraude. Als daarin kenmerken als postcodegebied of dubbele nationaliteit een rol spelen, kunnen bepaalde groepen benadeeld worden op basis van kenmerken die als zodanig niet relevant zijn voor het recht op een uitkering of een toeslag.

Een tweede nadeel van een algoritme is dat de hoeveelheid informatie waarmee het wordt gevoed per definitie beperkt is. Een algoritme zal doorgaans geen rekening houden met de subtiele verschillen tussen individuele gevallen, die voor een menselijke beoordelaar juist reden zijn om het ene geval anders te beoordelen dan een ander geval dat er veel op lijkt. Subjectieve informatie (houding, motivatie, oprechtheid) zal bij een algoritme in het algemeen geen rol kunnen spelen. Weliswaar is deze informatie een belangrijke bron van ruis, maar dat betekent nog niet dat het beter is dat ze in het geheel geen rol speelt.

Een derde nadeel is dat het gebruik van algoritmen de rol van uitvoerende medewerkers reduceert tot het verzamelen en invoeren van (objectieve) gegevens over een zaak. De professionele expertise van medewerkers wordt daarmee veel minder benut. Dit kan hun motivatie ondermijnen en daardoor ook de kwaliteit van de informatie die zij over een zaak verzamelen.

Wegen de nadelen van een algoritme zwaarder dan het voordeel dat de ruis geheel verdwijnt? Dat is niet in algemene zin te zeggen. Naarmate de ruis groter is en een belangrijker bron is van ongelijke behandeling van gelijke gevallen, is er meer reden om een algoritme te gebruiken om tot een oordeel te komen. Maar in veel gevallen is (nog) niet bekend hoe groot de ruis is en is het dus lastig om een afweging te maken. Meer onderzoek naar de omvang van ruis is dan ook zeer wenselijk.

We hoeven echter niet per se een keuze te maken tussen ofwel een algoritme gebruiken ofwel van menselijk maatwerk uitgaan. Het oordeel van een algoritme zou als een standaard of default kunnen fungeren. Dit sluit aan bij een aanbeveling van de Tijdelijke commissie Uitvoeringsorganisaties om ‘een hardheidsclausule op te nemen in wetgeving (die het professionals mogelijk maakt beargumenteerd van een wettelijke bepaling af te wijken)’.[9]

Ook de Nationale ombudsman pleitte in 2019 ervoor dat de overheid in een ‘noodsituatie’ zou moeten kunnen afwijken van de hoofdregel.[10] Met de uitkomst van een algoritme als default zal de uitvoerende professional niet in ieder individueel geval een eigen afweging maken, maar alleen in die gevallen waarin de uitkomst van het algoritme op gespannen voet staat met de redelijkheid of behoorlijkheid (een term die door de Nationale ombudsman wordt gebruikt).[11]

Het is dan wel van groot belang om zowel het functioneren van de medewerkers als de kwaliteit van het algoritme regelmatig te toetsen. De uitvoeringsorganisatie zou zorgvuldig moeten monitoren in welke mate individuele medewerkers afwijken van het advies van het algoritme. Medewerkers die veelvuldig milder of juist strenger oordelen dan het algoritme, zouden erop moeten worden aangesproken dat hun beoordelingen een systematische bias vertonen. Ook zou moeten worden gemonitord of individuele medewerkers in bepaalde gevallen – bijvoorbeeld bij aanvragers met een bepaald kenmerk of bij bepaalde soorten aanvragen – systematisch afwijken van het algoritme. Dit kan duiden op wat Kahneman c.s. pattern noise noemen, dat wil zeggen dat medewerkers alleen in specifieke gevallen een afwijkend oordeel vellen.[12] De ene medewerker is bijvoorbeeld geneigd strenger te zijn bij jongeren dan bij ouderen, terwijl een ander aanvragers met een buitenlandse achtergrond strenger beoordeelt. Een dergelijke bias zou een belangrijk gesprekonderwerp moeten zijn in het teamoverleg van uitvoerende professionals.

Als veel medewerkers een overeenkomstige afwijking van het algoritme laten zien, kan dit reden zijn om het algoritme zelf kritisch tegen het licht te houden, aangezien het kan duiden op een bias. Uitvoerende medewerkers kunnen op deze wijze helpen om onbedoelde en ongewenste effecten van de geldende regels in beeld te brengen en zo bijdragen aan verbetering van het algoritme. Hun professionele kennis en ervaring gaat dan een kleinere rol spelen bij de beoordeling van individuele gevallen, maar een grotere rol bij het evalueren van de regels. Voorwaarde hiervoor is wel dat de wijze van aansturing en beoordeling van uitvoerende medewerkers dit aanmoedigt. Professionals zullen dus niet primair beoordeeld moeten worden op het aantal gevallen dat zij behandelen. Gemotiveerd afwijken van het algoritme vergt immers tijd en inspanning.

Deze aanpak valt enigszins te vergelijken met die van het schooladvies aan het eind van de basisschool. De eindtoets vormt de basis voor het advies (vergelijkbaar met een algoritme), maar de school kan in het advies voor het vervolgonderwijs daarvan afwijken. Overigens leert dit voorbeeld ook het belang van een zorgvuldige monitoring, aangezien de afwijking van de eindtoets vaak een bias vertoont in het nadeel van scholieren met een lagere sociaaleconomische status.[13]

Toeslagenaffaire
Ogenschijnlijk levert de toeslagenaffaire vooral argumenten op tegen het gebruik van algoritmen. Immers, de massale terugvordering van soms zeer grote bedragen als de ontvangers van kinderopvangtoeslag maar een kleine fout hadden gemaakt, was het gevolg van het feit dat de ambtenaren van de Belastingdienst de wettelijke regels zeer strikt naleefden – inderdaad zoals een algoritme.

Zou de toeslagenaffaire voorkomen zijn als er bij de toekenning en terugvordering van kinderopvangtoeslagen meer ruimte was geweest voor maatwerk? Het staat wel vast dat er dan minder massaal en eenzijdig beslissingen ten nadele van de aanvragers van een toeslag zouden zijn genomen. Immers, juist vanuit de uitvoering werd al vroeg gesignaleerd dat de regels wel erg hardvochtig uitwerkten. Maar uiteindelijk is met die signalen niets gedaan.[14]

Maatwerk zou hebben geleid tot een grotere variatie in beslissingen. Maar dat zou niet noodzakelijkerwijs tot minder onrecht hebben geleid. Sommige uitvoerende ambtenaren van de Belastingdienst zouden lankmoediger zijn geweest en het door de vingers hebben gezien als een aanvrager niet precies aan alle voorwaarden voldeed of zouden een soepeler regeling hebben getroffen voor het terugbetalen van een onterecht ontvangen toeslag. Andere ambtenaren zouden veel meer naar de letter van de wet hebben gehandeld en geen andere beslissingen hebben genomen dan nu het geval was.

Doordat ieder individueel geval net weer iets anders is, zou niet snel aan het licht zijn gekomen dat de uitvoerders met verschillende maten meten. Een toeslagenaffaire zou er dan waarschijnlijk niet gekomen zijn, maar dat wil niet zeggen dat de uitvoering van de toeslagenwet daarmee veel rechtvaardiger zou zijn geweest. In plaats van ‘ongekend onrecht’ zou er dan sprake zijn geweest van ‘onzichtbaar onrecht’.

Stel echter dat de ambtenaren van de Belastingdienst de ruimte hadden gehad om gemotiveerd af te wijken van de regels, die feitelijk fungeren als een algoritme. Als die afwijkingen systematisch waren gemonitord zou waarschijnlijk eerder aan het licht zijn gekomen dat ambtenaren veelvuldig een gunstiger oordeel voor de aanvragers velden dan het algoritme adviseerde en zelden of nooit ongunstiger. Dat zou erop duiden dat veel ambtenaren de regels te hardvochtig vonden. Dit zou reden moeten zijn geweest om de wettelijke regels kritisch onder de loep te nemen. Vervolgens hadden deze signalen vanuit de uitvoeringsorganisatie ook weer bij de regering en de Tweede Kamer terecht moeten komen, zodat deze eventueel tot een wetswijziging of andere uitvoeringsregels hadden kunnen besluiten.

Rechtsgelijkheid in de waagschaal
Om beter in te spelen op de mogelijkheden en behoeften van individuele burgers is meer ruimte voor maatwerk van uitvoerende professionals een voor de hand liggende en op het eerste gezicht aantrekkelijke optie. Wie hiervoor kiest, zo heb ik in dit artikel betoogd, zal echter moeten accepteren dat er meer willekeur en ongelijke behandeling van (bijna) identieke gevallen zullen optreden. De ruis in de beoordeling van aanvragen zal sterk toenemen. Het is zeer de vraag of er dan minder onrecht zal geschieden dan in het verleden. Dit onrecht zal echter minder zichtbaar zijn en hierdoor minder maatschappelijke en politieke onrust oproepen. Maar dat mag natuurlijk nooit een reden zijn om het ene onrecht in te ruilen voor het andere.

Feitelijk betekent het vergroten van de ruimte voor maatwerk dat de ontwikkeling van de verzorgingsstaat een eeuw wordt teruggedraaid. Begin vorige eeuw was armoedebeleid in hoge mate een kwestie van maatwerk – dat behalve door gemeenten ook door particuliere charitatieve instellingen werd uitgevoerd. Als burger die in armoede verkeerde was je volledig afhankelijk van het persoonlijke oordeel van de ambtenaar of hulpverlener die jouw zaak behandelde. Dat ging zowel gepaard met een sterke bias – bepaalde groepen hadden veel meer kans om geholpen te worden dan andere – als met veel ruis - vergelijkbare gevallen konden door verschillende ambtenaren heel verschillend worden beoordeeld.

Dit gebrek aan rechtsgelijkheid en rechtszekerheid was een belangrijke reden om de ruimte voor discretionaire bevoegdheden te verminderen en in de wet meer dwingende en gedetailleerde regels op te nemen over de voorwaarden voor steun. Zo konden gemeenten tot 1974, toen het Besluit Landelijke Normering werd ingevoerd, zelf beslissen over de hoogte van een bijstandsuitkering, hetgeen tot aanzienlijke verschillen tussen gemeenten leidde.[15] In 1980 werden ook de criteria voor de toekenning van een bijstandsuitkering centraal vastgelegd in het Bijstandsbesluit Landelijke Draagkrachtcriteria.[16]

Laten we niet vergeten hoeveel vooruitgang dit heeft gebracht in termen van rechtszekerheid en rechtsgelijkheid voor burgers. Het zou heel onverstandig zijn dit alles weer in de waagschaal te stellen door ondoordacht veel meer ruimte te bieden voor maatwerk. Het zou echter wel goed zijn als uitvoerende professionals meer ruimte zouden krijgen om gemotiveerd af te wijken van de letter van de wet of van het advies van een algoritme. Dit zou echter wel een uitzondering moeten zijn, aansluitend op het advies uit Klem tussen balie en beleid om een hardheidsclausule in te voeren.

Deze afwijkende oordelen zouden goed moeten worden gemonitord, om te kunnen signaleren of sommige uitvoerders systematisch een afwijkend oordeel vellen en dus mogelijk een bias hebben of dat veel uitvoerders in bepaalde gevallen afwijkend oordelen, hetgeen op een bias in de formele regels of het algoritme duidt. In het laatste geval zou dat reden moeten zijn om de regels of het algoritme kritisch te bezien en eventueel aan te passen. Als dit bij de kinderopvangtoeslagen was gebeurd, zouden de signalen van mogelijk onrecht eerder bij de politiek verantwoordelijkheden terecht zijn gekomen, al biedt dit geen garantie dat zij daar dan ook adequaat op gereageerd zouden hebben.

Dat de toeslagenaffaire, maar ook het parlementaire onderzoek naar uitvoeringsorganisaties, aanleiding is kritisch te kijken naar de uitvoering van wetten en regels is een goede zaak. Het risico is echter dat we, uit angst dat er nogmaals een toeslagenaffaire komt, te veel naar het andere uiterste doorslaan. Dan zal systematisch onrecht worden vervangen door willekeurig onrecht, doordat burgers te sterk afhankelijk worden van het wisselvallige oordeel van uitvoerende professionals.

Noten

  1. Met dank aan Mark Bovens voor commentaar op een eerdere versie.
  2. Kahneman, D., Sibony, O. & & Sunstein, C.S. (2021). Noise. A flaw in human judgment. Hachette Book Group.
  3. WRR. (2017). Weten is nog geen doen. Een realistisch perspectief op redzaamheid. Rapport nr.97. Den Haag: Wetenschappelijke Raad voor het Regeringsbeleid.
  4. Tijdelijke commissie Uitvoeringsorganisaties (2021). Klem tussen balie en beleid. Tweede Kamer 35.387 nr.2, p. 153.
  5. Ministerie van SZW. (2021, 25 juni). Kabinet presenteert aanpak om publieke dienstverlening te verbeteren. Rijksoverheid.nl.
  6. De Nationale Ombudsman (2019). Invorderen vanuit het burgerperspectief. Rapport 2019/005. Den Haag: De Nationale Ombudsman.
  7. BNR. (2021, 14 april). AFM: Belastingdienst moet maatwerk leveren. BNR.nl.
  8. J.P.H. Donner (2016, 2 juni). Laat je niet gek maken. Toespraak voor het Divosa Voorjaarscongres 2016.
  9. Tijdelijke commissie Uitvoeringsorganisaties (2021). Klem tussen balie en beleid. Tweede Kamer 35.387 nr.2, p. 153.
  10. De Nationale Ombudsman (2019). Invorderen vanuit het burgerperspectief. Rapport 2019/005. Den Haag: De Nationale Ombudsman. p. 18.
  11. In beginsel kan ook de omgekeerde volgorde worden gebruikt: eerst velt de uitvoerder een oordeel en toetst deze vervolgens aan het algoritme. Dit lijkt echter een weinig efficiënte en dus kostbare aanpak, aangezien het oordeel van een algoritme veel sneller en goedkoper is dan dat van een menselijke beoordelaar.
  12. In statistische termen is er dan sprake van een significant interactie-effect.
  13. Van Eck, D. & Meesters, I. (2020). Rapport wegvallen eindtoets. Dienst Uitvoering Onderwijs.
  14. Zie bijvoorbeeld Frederik, J. (2021). Zo hadden we het niet bedoeld. De Correspondent.
  15. H.G. De Gier (1987), De Algemene Bijstandswet en de nieuwe armoede. ESB. 72 (3620) pp. 786-794.
  16. Idem.

Auteur(s)

Dossiers

Voor een thematisch overzicht van al onze artikelen en publicaties, zie onze dossiers

Steun de Wiardi Beckman Stichting

Veel van onze onderzoeksprojecten en publieke bijeenkomsten zijn mogelijk gemaakt door giften van donateurs. Ook S&D zouden wij niet kunnen maken zonder donaties.