Wat willen die lui? Bas Haring duikt in het hoe en waarom van de CPB-modellen
Het CPB bestaat 75 jaar. In dat kader vroeg het CPB aan filosoof Bas Haring om naar het CPB en de modellen van het CPB te kijken. Hij reflecteert in het geïllustreerde boekje 'Wat willen die lui' met een serie vragen en antwoorden.
De volledige inhoud van het boekje is hieronder per hoofdstuk te lezen.
Beluister het boek hieronder:
Of beluister per hoofdstuk, via de hieronder getoonde hoofdstukken.
U kunt het boekje ook als pdf downloaden: 'Wat willen die lui' (31 pagina's | 15 MB)
Op 15 september 1945, direct na de Tweede Wereldoorlog, startte het Centraal Planbureau zijn werkzaamheden. Nu, 75 jaar later, zit Nederland opnieuw in een ongekende crisis. De economische ontwikkeling is door de coronapandemie fundamenteel onzeker. Mensen verliezen hun baan en zien hun leven drastisch veranderen. De overheid zet alles op alles om de samenleving draaiende te houden en het coronavirus onder controle te krijgen. De behoefte aan zicht op de toekomst is groot.
Als gevolg van alle onzekerheid staan de macro-economische ramingen op basis van de CPB-modellen weer volop in de schijnwerpers. Maar het CPB doet veel meer dan ramen: van maatschappelijke kosten-batenanalyses tot onderzoeken naar (kansen)ongelijkheid. En het CPB ís meer dan modellen: onze medewerkers vormen het brein, het hart en het geweten van het bureau. Zij weten dat modeluitkomsten niet alles zeggen - welvaart en geluk zijn meer dan de ontwikkeling van het bruto binnenlands product, politieke keuzes gaan over meer dan cijfers.
Toch ligt de focus in dit boekje op de ‘modellenwerkelijkheid’. Wat hebben we eigenlijk aan de ramingen van het CPB? Hoe betrouwbaar zijn ze, en hoe accuraat zijn de modellen? Dat zijn vragen die ons regelmatig - en terecht - worden gesteld. Economen hebben daar uitgebreide antwoorden op, vol met termen als betrouwbaarheidsintervallen, puntprecisie en opwaartse en neerwaartse bijstellingen. Voor onszelf helder en genuanceerd, maar voor de buitenwereld vaak erg ingewikkeld.
Het leek ons daarom een goed idee om Bas Haring - filosoof, géén econoom - te vragen in onze modellen te duiken en het nut en de beperkingen daarvan te illustreren. Geen gemakkelijke opgave, maar het resultaat mag er zijn. Dit boekje geeft antwoord op (bijna) alle vragen over economische modellen die u (nooit) durfde te stellen.
Ik wens u veel leesplezier,
Pieter Hasekamp, directeur Centraal Planbureau
Klik hieronder voor de luisterversie:
Het Centraal Planbureau bestaat 75 jaar. Dat is een goed teken; dan doen ze daar blijkbaar iets zinvols. Anders was het bureau wel opgedoekt. Maar wat doen ze er dan? De naam is wat archaïsch: een “planbureau”; wat is dat? En het is een “centraal” planbureau nog wel.
Een aantal dingen over het CPB zullen algemeen bekend zijn. Dat ze er de verkiezingsprogramma’s “doorrekenen”. Hoewel dat natuurlijk nooit de hoofdtaak van een bureau kan zijn; verkiezingen vinden maar eens in de paar jaar plaats. En veel mensen weten ook wel dat het CPB economische vooruitzichten maakt. Of “ramingen” in de terminologie van het CPB. De bekendste raming is de septemberraming – ook wel “mev”, van macro-economische verkenning – die jaarlijks op Prinsjesdag wordt gepubliceerd, samen met de miljoenennota. Het is een heel document, met analyses en onderbouwingen, maar een van de hoofdpunten is steevast: “De economisch groei zal komend jaar, vermoedelijk en ongeveer, puntje puntje procent bedragen”. Toch zullen veel mensen vragen hebben bij het CPB: Hoe maakt men die ramingen dan? Hoe goed zijn ze? En waartoe dienen ze precies? In dit geïllustreerde essay wil ik ingaan op dit soort vragen. Niet omdat ik bij uitstek de persoon ben om ze te beantwoorden, maar wel omdat ik ze goed kan stellen – ik ben filosoof, geen econoom.
Tinbergen schreef dat hem over het CPB gevraagd werd: "Wat willen die lui?"
Dat het CPB vaker en al langer vragen oproept blijkt wel uit een tekst van Jan Tinbergen naar aanleiding van het 25-jarig bestaan van het CPB; vijftig jaar geleden dus. Jan Tinbergen, overigens, was de eerste directeur van het CPB en kan gezien worden als de oprichter ervan, hoewel dat formeel de regering was. Tinbergen schreef dat hem in de beginjaren nog wel eens argwanend over het CPB gevraagd werd: “Wat willen die lui?” Het is een mooie beknopte verwoording van de vragen die in dit essay voorbij gaan komen. “Wat willen die lui?” vraagt naar de kern van het CPB – Waartoe bestaat die organisatie? – en klinkt bovendien plezierig informeel.
Om zo’n vraag naar de kern van iets te beantwoorden is het altijd handig om terug te gaan naar het verleden. Naar toen het allemaal begon: de essentie van iets verandert in de regel maar langzaam en weinig.
In 1936, bijna tien jaar voordat Jan Tinbergen directeur van het CPB werd, schreef hij een veel geciteerd en feitelijk zelfs beroemd artikel: “Kan hier te lande, al dan niet na overheidsingrijpen, een verbetering van de binnenlandsche conjunctuur intreden, ook zonder verbetering van onze exportpositie?” Het artikel beschrijft de Nederlandse economie met een verzameling wiskundige vergelijkingen en wordt gezien als het allereerste “moderne” economische model van een land.
In dat artikel maakt Tinbergen een grafiek die goed antwoord geeft op de vraag wat die lui van het CPB willen. Horizontaal in de grafiek staat de tijd; zeven jaren in totaal, en verticaal de werkgelegenheid. Niet de bekende werkgelegenheid uit het verleden, maar de voorspelde werkgelegenheid in de nabije toekomst. In 1936 was de werkgelegenheid laag: 22 procent lager dan wat Tinbergen als normaal veronderstelde. Zes verschillende lijnen schetsen wat er met de werkgelegenheid gaat gebeuren in de zeven jaren na 1936, afhankelijk van de besluiten die de regering neemt. Bij een devaluatie van de gulden zou de werkgelegenheid flink en ook bestendig stijgen; het investeren door de overheid in openbare werken zou ook soelaas bieden, maar toch iets minder en vooral ook minder lang. Terwijl andere maatregelen nauwelijks positief effect zouden hebben.
Wat een handige grafiek! Wil je als overheid de werkloosheid bestrijden – een in de ogen van Jan Tinbergen zeer logische doelstelling – dan laat de grafiek goed zien welke maatregelen het beste werken. Kwantitatief – met heldere cijfers – en op basis van economische wetenschap. Dit soort grafiekjes wil je; als je een regering bent. En precies wat het grafiekje doet, doet het CPB: de overheid helpen om gedegen beslissingen te nemen, op basis van inschattingen die gefundeerd zijn in wetenschap. Dat willen die lui dus! En de strategie die Tinbergen gebruikte – gebaseerd op wiskundige, economische modellen – gebruikt het CPB feitelijk nog steeds. Het begrip “model” zal dan ook tamelijk centraal staan in deze tekst, hoewel ik niet de indruk wil wekken dat ze bij het CPB slechts rekenen met wiskundige modellen. Ze schrijven er ook rapporten, maken analyses, enzovoort. Maar toch, omdat die modellen zo kenmerkend zijn voor de geschiedenis van het CPB veel aandacht daarvoor.
Dit soort grafiekjes wil je; als je een regering bent
Ik vind het CPB wel te vergelijken met de sport-wetenschappers waar moderne voetbaltrainers steeds vaker gebruik van maken. Wetenschap speelt een steeds belangrijker rol in het voetbal: wat spelers eten en drinken wordt goed bijgehouden; en tijdens een wedstrijd registreren camera’s langs het veld continu waar spelers staan en wat ze doen. Speciale sport-wetenschappers analyseren deze gegevens en kunnen zo de trainer helpen gefundeerde beslissingen te nemen. Eigenlijk lijkt de taak van het CPB wel wat op die van zo’n sport-wetenschapper. Het team is dan de samenleving, en de trainer de overheid – of de regering.
Ik zal deze voetbal-metafoor later in dit essay wat verder uitwerken, maar vooralsnog heeft-ie één les (daar zijn metaforen voor; om lessen uit te trekken): de voetbaltrainers die sport-wetenschappers inhuren worden meestal gezien als goede, professionele trainers. In analogie lijkt mij een overheid die wetenschappers als die van het CPB inhuurt een verstandige, professionele overheid. Maar ondanks deze, voor het CPB positieve les, hou ik een aantal vragen. Vragen die stuk voor stuk aan de orde zullen komen in dit verhaal.
Klik hieronder voor de luisterversie:
De economische wetenschap is tegenwoordig sterk wiskundig, maar dat is niet altijd zo geweest. In de tijd dat Tinbergen dat eerder genoemde beroemde artikel schreef, was economie eerder een “talige” wetenschap. Als economen invloed probeerden uit te oefenen op de politiek, dan deden ze dat vaak met woorden en argumenten in plaats van met wiskunde, zoals Tinbergen deed.
Wiskunde is argumentatief ook niet zo sterk. Het is “specialisten-taal” die niet voor iedereen overtuigend is. De niet-ingewijde kan makkelijk reageren met: “Dat staat er allemaal wel, maar hoe kan ik weten dat het klopt? Leg eens in woorden uit wat u precies bedoelt.” Toch is het heel logisch dat de rol van wiskunde in de economische wetenschap zo groot is. Een voorbeeld: stelt u zich voor dat de prijs van auto’s stijgt. Om wat voor reden dan ook. Gaan mensen dan méér of minder fietsen kopen?
Meer! Want de vraag naar auto’s zal zakken; mensen zullen een alternatief zoeken; en fietsen zijn zo’n alternatief.
Minder! Omdat mensen meer geld kwijt zijn aan hun auto, hebben ze minder te besteden aan andere zaken zoals fietsen.
Beide opties klinken redelijk, maar wat gaat het worden? Het probleem van taal is dat die niet kwantitatief is en dat je zinnen niet kunt optellen en aftrekken. Je kunt moeilijk zeggen dat het eerste argument voor twee derde waar is, en het tweede argument voor de resterende één derde. Dat staat taal niet zo makkelijk toe. Maar verpak de argumenten in wiskunde en dan kan het wel. Op basis van kennis uit het verleden kan een inschatting worden gemaakt hoe groot beide effecten zijn en kan een voorspelling – of “raming” – worden gemaakt van wat er met de fietsverkoop gebeurt bij een stijgende autoprijs. Reuzehandig en een goede reden dus om economische uitspraken in wiskunde te gieten. Bovendien, als we teruggaan naar het antwoord op de vraag “Wat willen die lui?”, dan is toch evident dat kwantitatieve uitspraken handig of zelfs noodzakelijk zijn. Wanneer een overheidsmaatregel zowel voor- als nadelen heeft, dan is het toch prettig om te weten hoe groot die voordelen en nadelen zijn? Alleen taal voldoet dan niet.
Een model is een versimpelde weergave van het een of ander.
Maar wat is dan een model? Een model is een versimpelde weergave van het een of ander. Een modelautootje heet niet voor niets zo. Het is een versimpeling van een echte auto. Details zijn weggelaten: er zit geen werkende motor in en de ruitenwissers doen het niet, maar zo’n ding ziet er wel uit als een auto en kan voor sommige zaken wel “model staan” voor een echte auto. Economische modellen zijn niet als modelautootjes. Ze zijn geen verkleining van de economische realiteit. Een economisch model is eerder een versimpelende “abstractie”, maar ik weet niet of dat verhelderend is. Een voorbeeld werkt misschien beter.
Een klassiek wiskundig model is dat van een slinger. Zo’n slinger als er in een Friese staartklok hangt. Dat model ziet er uit zoals op het plaatje links.
Waarbij φt staat voor de hoek die de slinger maakt op tijdstip t, g staat voor de zwaartekracht(versnelling) en voor de lengte van de slinger. De uitdrukking beschrijft hoe de uitslag van de slinger in de loop van de tijd verandert nadat je hem op enig moment (tijdstip nul) hebt losgelaten. Maar u mag dit allemaal weer vergeten!
Er zijn twee dingen die u wel onthouden moet. Ten eerste ziet dit model er relatief eenvoudig uit. Het zijn niet zoveel tekentjes en er komen geen heel ingewikkelde symbolen in voor: die staat voor de cosinus die u vast nog kent van de middelbare school. En het tweede wat u moet onthouden is dat het model nagenoeg perfect is: de uitdrukking beschrijft zeer nauwkeurig hoe een slinger zich in de loop van de tijd zal gedragen. Of-ie nou van metaal is en een meter lang, zoals in een Friese staartklok. Of van hout en wel tien meter. Bovendien werkt het model altijd en overal: in Frankrijk en in Nederland; door de week en in het weekend.
De uitdrukking hiernaast is een model, in die zin dat het een versimpeling is van een concreet ding. Maar het is een heel ander model dan een modelauto. Het is geen fysieke maar abstracte versimpeling. Economische modellen zijn ook zulk soort versimpelingen: wiskundige uitdrukkingen die de hoofdprocessen in een economie beschrijven. Maar ze zien er wel anders uit dan bovenstaande slingervergelijking.
Heel anders.
Klik hieronder voor de luisterversie:
Het CPB gebruikt meerdere modellen. Waaronder een model dat raamt hoeveel en welke mensen er aan het werk zijn (MICSIM), een model voor de koopkracht van verschillende bevolkingsgroepen (MIMOSI), en een model dat toekomstige belastinginkomsten schat (TAXUS). Maar er is één model dat een soort van centrale rol vervult. Het “werkpaard” van het CPB. En dat is het model dat tegenwoordig SAFFIER II heet.
Tien jaar terug was het nog gewoon SAFFIER (zo ga ik het de rest van deze tekst ook noemen); daarvoor was het JADE, en weer daarvoor FREIA en KOMPAS. Het is het model voor de gehele Nederlandse economie, en het is feitelijk een voortzetting van het allereerste model van Tinbergen – uit 1936 dus. SAFFIER gaat over grote, macro-economische begrippen, zoals: de totale waarde van alle zaken die in Nederland worden geproduceerd; en de gehele werkloosheid in Nederland; of de optelsom van al het Nederlandse spaargeld. Tussen deze begrippen bestaan relaties. Sommige van die relaties zijn noodzakelijk en logisch, zoals bijvoorbeeld de volgende: “Wat we in totaal verdienen in Nederland is evenveel als wat we uitgeven, plus wat we sparen.”
En andere relaties zijn eerder lessen uit het verleden die gegoten zijn in het formaat van een wiskundige vergelijking. (Zo dadelijk geef ik een voorbeeld.)
In totaal bestaat SAFFIER uit ruim tweeduizend vergelijkingen. De meeste daarvan zijn vergelijkingen van de eerste aard: “identiteiten”, vergelijkingen die uitdrukken dat het ene logisch en noodzakelijk gelijk moet zijn aan het andere. Dan zijn er nog paar honderd zogenaamde “vuistregels”, die ik voor het gemak even negeer. En de kern, waar het uiteindelijk om gaat, bestaat uit 25 wat het CPB “gedragsvergelijkingen” noemt. (Dat woord “gedrag” overigens duidt op het gedrag van de economie als geheel en niet op het gedrag van consumenten of bedrijven.)
Die 25 gedragsvergelijkingen beschrijven talloze relaties die van belang zijn in de Nederlandse economie:
-
De relatie tussen productie en investeringen;
-
tussen de hoogte van lonen en de werkgelegenheid;
-
de consumptie van mensen en hun inkomen;
-
de relatie tussen de totale uitvoer en de prijzen in andere landen, enzovoort.
Bij één zo’n vergelijking wil ik stilstaan. Omdat het me leerzaam lijkt de aard van de vergelijkingen in SAFFIER te kennen. Ik heb voor de vergelijking gekozen die hieronder staat. Die is relatief kort, en gaat over iets eenvoudigs. Namelijk de vakantie-uitgaven door Nederlanders in het buitenland. (Het is de vraag of deze vergelijking in dit uitzonderlijke corona-jaar nog steeds opgaat, maar dat negeer ik even. En feitelijk gaat de vergelijking ook nog over dienstreizen, maar die negeer ik ook.)
Vergelijking 4.26
Oftewel: “V is C tot de macht 1,38 maal Pc gedeeld door Pv in het kwadraat.” Waarbij V staat voor het totaalbedrag dat aan vakanties uitgegeven wordt (door alle Nederlanders bij elkaar); C staat voor uitgaven aan “consumpties” in het algemeen; en P staat voor de prijs (van C en V).
Consumpties, overigens, zijn de gewone uitgaven die een huishouden doet: aan eten, kleding, vervoer enzovoort – uitgaven aan zorg en wonen zitten er niet in.
Vergelijking 4.26 ziet er misschien ingewikkeld uit, maar er staat feitelijk iets tamelijk eenvoudigs. Het eerste deel na het is-teken zegt: “Als mensen meer te besteden hebben – laten we zeggen tien procent meer – dan gaan de uitgaven aan vakanties méér dan tien procent omhoog.” (“Meer” is een wat vage aanduiding; hoeveel meer precies vertelt die 1,38.) Vrij logisch: wanneer je al je boodschappen en vaste lasten kunt betalen, en dan honderd euro per maand extra krijgt; dan gebruik je vermoedelijk een relatief groot deel van die honderd euro voor vakanties en andere “leuke dingen”. En het tweede deel na het is-teken betekent dat mensen minder gaan uitgeven aan vakanties, als deze duurder worden. Logisch.
De oorsprong van de vergelijking is een mix van statistiek en economisch inzicht. Economisch inzicht vertelt dat er überhaupt een relatie is tussen uitgaven aan vakantie en andere consumpties; en vertelt dat die relatie belangrijk genoeg is om op te nemen in een model over de gehele Nederlandse economie. Terwijl die 1,38 en die 2,0 het resultaat zijn van statistiek: het zijn schattingen op basis van gegevens uit het verleden.
Zo’n vergelijking leest van links naar rechts. Wil je weten hoe groot V is; dan moet je C, Pv en Pc invullen en klaar is kees. Deze cijfers krijgt het CPB van het CBS. Bij andere vergelijkingen is het wat minder makkelijk en moeten cijfers worden ingevuld die zelf ook ergens aan de linkerkant van het is-teken staan.
Het hele stelstel van vergelijkingen zit zo in elkaar dat als je alle bekende gegevens hebt ingevuld, de computer eenvoudig de ontbrekende gegevens kan vinden. Als een grote sudoku lost-ie de puzzel vanzelf op. Of in de woorden van Tinbergen: “De vergelijkingen worden als het ware in de wiskundige machine gelegd die het resultaat ineens levert.” Nu kan ik me voorstellen dat dit allemaal vrij behapbaar overkomt. Dat is ook deels mijn doel. Maar aan de andere kant is SAFFIER toch wel een tikkeltje complexer dan slechts die ene vergelijking zoals hierboven getoond. Voor uw beeldvorming en om u te laten schrikken; de volgende vergelijking zit ook in SAFFIER en wat hij precies betekent laat ik even in het midden:
Mocht u nieuwsgierig zijn: deze vergelijking gaat over de zogenaamde “vrije consumptie” van alle huishoudens. Dat is het overgrote deel van alle consumptie en het tegenover-gestelde van de “onvrije consumptie”: uitgaven waar niks te kiezen valt, zoals aan administratiekosten van pensioenfondsen en levensverzekeringsmaatschappijen.
En wat kun je nou allemaal met deze wiskundige machinerie?
Drie dingen:
-
Voorspellen of ramen. Vul de data van nu in het model, en de toekomstige data rollen eruit. Precies daar is SAFFIER voor bedoeld. Je kunt SAFFIER gebruiken voor relatief kortetermijn-ramingen: drie maanden vooruit. En langeretermijn-ramingen: tot een jaar of vier.
-
Scenario’s schetsen. Wil je weten wat er gebeurt als de benzine tien keer zo duur wordt? Verander de prijs van benzine in het model en aanschouw de gevolgen. (De benzineprijs zit niet direct in SAFFIER, maar een algemene energieprijs wel.)
-
Overheidsbeleid analyseren. Een bijzonder type scenario is het overheidsbeleid. Wat gebeurt er als we stoppen met de export van gas? Als we de pensioenleeftijd op zeventig zetten? Of het hoge btw-tarief verlagen naar tien procent? SAFFIER rekent het door. Precies in lijn met wat die lui van het CPB willen: inschatten wat de gevolgen van overheidsbeleid zullen zijn.
Zo werkt dat dus. In principe. Maar hoe werkt het nou in het echt? Wat gebeurt er in het CPB-kantoor als de modellen een raming maken?
Klik hieronder voor de luisterversie:
Ik had niet echt een beeld van het CPB-kantoor, maar in mijn beleving had het zo kunnen zijn dat er een grote centrale controlekamer is. Zo’n ruimte als de NASA heeft; waar iedereen gespannen naar computers kijkt wanneer een raket wordt gelanceerd. Ik stel me dan voor dat CPB-ers gezamenlijk naar een groot scherm kijken waarop te zien is wat de modellen voorspellen over onze economie voor de komende tijd. Maar zo gaat het niet, en het CPB heeft geen controlekamer. (Wel een ruimte die war room wordt genoemd, maar daar gebeuren andere dingen.) Het maken van een raming is een tamelijk “bescheiden” proces; uitgevoerd door twee mensen, die wel zoveel mogelijk anderen, experts, daarbij betrekken.
Voor de goede orde: het schrijven van zo’n heel rapport gebeurt door heel wat mensen, maar “het draaien van het model” gebeurt met z’n tweeën.
Het maken van een raming – of het “draaien” van het model zoals ze dat bij het CPB noemen – begint met het verzamelen van een aantal gegevens. Die komen van het CBS, maar ook van het CPB zelf. Gegevens over de overheidsfinanciën bijvoorbeeld, die SAFFIER nodig heeft, komen uit het model emu. (Dat overigens heel anders van aard is dan SAFFIER: emu is eerder een boekhoudprogramma.) Die data zit gewoon in spreadsheets: eenvoudige tabellen met nummertjes. De spreadsheets worden ingeladen in SAFFIER en dan drukt iemand simpelweg op return; op een heel gewone computer, en een paar minuten later is de raming daar.
Als een eerste kwaliteitscontrole kijkt de persoon die ook return indrukte met een verstandige blik naar de resultaten: “Ziet dit er een beetje logisch uit.” Als de raming zegt dat het bruto binnenlands product (dat wat we met z’n allen in Nederland verdienen) plots inzakt zonder dat daar een logische aanleiding voor is, dan klopt er wellicht iets niet.
Het is altijd mogelijk om met de hand wat bij te 'tunen'.
Misschien zat er een fout in de data of stond er een parameter verkeerd. Het is altijd mogelijk om met de hand wat bij te “tunen”. De parameters in SAFFIER worden geschat op basis van het verleden en het kan goed zijn dat ze niet meer up-to-date zijn. Dan is het misschien verstandig een parameter handmatig een beetje aan te passen.
Als er voldoende vertrouwen is in de kwaliteit van de raming, dan volgt er nog een slag. De output van SAFFIER is nu input van andere modellen op het CPB. Het eerder genoemde EMU-model bijvoorbeeld levert niet alleen gegevens aan SAFFIER, maar heeft zelf ook gegevens uit SAFFIER nodig. Resultaten van SAFFIER gaan dus weer terug naar EMU, dat op zijn beurt weer aan het draaien gaat en de vernieuwde resultaten worden weer in SAFFIER gestopt. Dit hoeft maar twee keer: dan convergeren de resultaten wel naar iets stabiels.
Uiteindelijk wordt de raming nog bekeken door experts op het CPB zelf. Zit er een steekhoudend verhaal achter de voorspelde ontwikkelingen? Ook nu is er weer de mogelijkheid de resultaten wat aan te passen, en dan is uiteindelijk de raming klaar. Het steekhoudende verhaal moet dan nog worden opgeschreven, en het resultaat is een rapport. Een paar keer per jaar gebeurt dit zo, en meestal is het groot nieuws in de kranten: “Het CPB voorspelt voor komend jaar een groei van de economie van één procent.”
Hoewel het CPB-kantoor dus geen centrale controlekamer heeft, en CPB-ers niet gezamenlijk naar grote schermen kijken “zoemen” de grote ramingen wel degelijk door het gebouw. Bij het koffieapparaat en in de wandelgangen heeft men het er over: Wat gaat het bruto binnenlands product doen? En hoe groot wordt de werkloosheid? Het zijn twee tamelijk belangrijke graadmeters voor de toestand in onze samenleving. Niet alleen voor de mensen op het CPB, maar ook voor jan-en-alleman.
Klik hieronder voor de luisterversie:
Het verhaal achter zo’n raming staat flink ver af van hoe het met een slinger zat. Daar ging het om één, tamelijk simpele vergelijking die nagenoeg perfect het gedrag van zo’n slinger kan voorspellen. En hier zien we honderden vergelijkingen; een wirwar van modellen die elkaars voorspellingen gebruiken, en die bovendien nog bijgestuurd kunnen worden door mensen. Ik realiseer me dat “wirwar” misschien wat negatief overkomt, maar ik bedoel er slechts een complex netwerk van onderlinge relaties mee. Experts weliswaar, maar zoiets is bij de slingervergelijking niet nodig.
Op zich zijn die verschillen niet onlogisch: Een slinger is een heel ander ding dan een economie. Zo’n slinger is voorspelbaar; gedraagt zich altijd hetzelfde; en is goed te modelleren. Terwijl een samenleving of economie een grillig geheel is, dat allicht niet zo makkelijk in een handvol wiskundige vergelijkingen te vatten is. Toch zijn de verschillen tussen het model van een slinger en een macro-economisch model wel erg groot. Zo groot dat dat vragen oproept. Twee soorten vragen. Vragen over de rol van macro-economische modellen. Wat is hun functie binnen het CPB? En vragen over de aard van die modellen; over hoe ze eruit zien. Maar eerst over hun rol.
Idealiter is een model een perfecte voorspeller. Dan is zo’n model het meest geschikt voor het analyseren van overheidsmaatregelen. Maar macro-economische modellen zijn niet perfect. Sterker nog; ze staan erom bekend dat ze eigenlijk helemaal niet zo goed kunnen voorspellen. (Ik vermoed dat men precies daarom op het CPB het wat genuanceerde begrip “ramen” gebruikt.) Toch ziet men, al of niet bewust, zo’n model al snel als een “voorspel-machine”. Een tool die laat zien hoe de toekomst eruit ziet: een glazen bol. Maar het proces rondom SAFFIER suggereert dat het model die rol helemaal niet heeft.
De rol van SAFFIER binnen het CPB lijkt eerder op die van een hyper-rationele sparringpartner of secondant. Een beetje zoals Mr. Spock in Star Trek. De economie is een ingewikkeld geheel met allerlei complexe relaties. Of in de woorden van Tinbergen: “Het gaat hier om een ingewikkelde materie... omdat veel verschillende grootheden in het economisch mechanisme met elkaar verbonden zijn.” Een gewone sterveling kan al die onderlinge verbanden maar moeilijk overzien. Maar SAFFIER kan dat wel. Net als Mr. Spock. En net als SAFFIER heeft Spock onvolkomenheden: Spock begrijpt bijvoorbeeld weinig van menselijke emoties, en wanneer die een grote rol spelen maakt hij fouten. Spock is geen alleskunner waar je blind op kunt varen, maar het is reuzehandig dat-ie er is. Soms moeten z’n uitspraken en adviezen een beetje worden bijgestuurd, maar het is bijna altijd verstandig om rekening te houden met wat Spock zegt. En misschien zit het net zo met SAFFIER. SAFFIER kan werken met verbanden die voor ons te ingewikkeld zijn, maar je moet er niet blind op varen.
Is die rol van rationele secondant oké? Het is misschien niet wat men van een macro-economisch model verwacht, en het is de vraag of Tinbergen tevreden zou zijn met een dergelijke rol voor zijn modellen. En het zou vast nóg mooier zijn als er wel een glazen bol of perfecte voorspeller bestond. Maar zo lang die er niet is en men wel beschikt over een secondant, dan is het toch verstandig deze serieus te nemen?
De rol van SAFFIER als rationele secondant is een mooie rol. Zo lang men maar niet denkt dat de rol van SAFFIER een andere is.
En over de aard van SAFFIER rijzen de volgende vragen:
-
Hoe goed zijn die modellen eigenlijk? En kunnen ze niet beter?
Macro-economische modellen zijn berucht vanwege het feit dat ze zelfs heel grote veranderingen niet goed voorspellen – zoals de recessie van 2008. Die was niet het gevolg van een compleet onvoorziene externe oorzaak; zoals een nieuw coronavirus. De oorzaak zat in de economie zelf, en toch waren er maar weinig macro-economische modellen die de crash van 2008 voorspelden. Kan dat op de een of andere manier niet beter? -
Kan het niet wat eleganter?
Je hebt elegante wiskunde en minder elegante. Ik hoop niet dat ik hoef uit te leggen wat het verschil precies is; ik zou het lastig vinden. Maar hoe dan ook is SAFFIER niet elegant. Je zou het zelfs een beetje lelijk kunnen noemen: een brij van vergelijkingen die niet eens op elkaar lijken. Kan dat niet anders? En zou dat helpen? -
En waarom moeten die modellen steeds worden bijgesteld?
De slingervergelijking staat vast en verandert niet. En ook de parameters in het model (die en ) blijven altijd gelijk. Dat macro-economische modellen geregeld aangepast worden suggereert dat vorige versies niet goed waren. Maar als die niet goed waren, waarom de huidige versie dan wel? -
Lijken alle modellen van het CPB op elkaar?
Dat huidige model SAFFIER heeft een heel specifieke vorm van honderden vergelijking. Is dat met de andere modellen die het CPB gebruikt net zo? Of zitten die misschien heel anders in elkaar en hoe verhouden ze zich dan tot zo’n slingervergelijking?
Een gek kan meer vragen dan een wijze kan beantwoorden. Toch geloof ik niet dat bovenstaande vragen “gekke vragen” zijn. Het zijn heel logische vragen die de half-geïnformeerde leek graag beantwoord ziet. Vandaar dat ik dat zal proberen.
Klik hieronder voor de luisterversie:
In september 2019 voorspelde het CPB dat de Nederlandse economie in 2020 met 1,5 procent zou groeien. Het gaat een daling worden; van meerdere procenten. Allicht vanwege het coronavirus. De jaren ervoor deed het CPB het een stuk beter, en lag de geraamde groei steeds redelijk in de buurt van de werkelijke groei. Maar het had heus nog wel beter gekund. Vooral 2009 was lastig: voor dat jaar raamde het CPB een groei van 2,5 procent, maar het werd een daling van vijf.
Feitelijk zijn de ramingen altijd omgeven met onzekerheid, alleen hoor je die meestal niet in de media. Als er staat: “Het CPB voorspelt voor volgend jaar een economische groei van 1 procent,” dan moet er eigenlijk nog bij staan: “plus of min 0,2”. Een paar van zulke onzekerheden achter elkaar wordt een hele grote onzekerheid. Vraag het CPB niet om zeven jaar vooruit te ramen – zoals Tinbergen deed in 1936. De resultaten zouden tamelijk onbetrouwbaar zijn. Allicht is een macro-economische verkenning veel meer dan slechts een nummer, maar dat nummer (de economische groei) is wel steevast een belangrijk cijfer van zo’n MEV.
Je zou toch haast denken dat de modellen beter moeten kunnen. Maar voordat je tot die conclusie kan komen is het verstandig te om te achterhalen hoe het komt dat die ramingen niet beter zijn. Ik zie vier redenen (maar het kan best dat iemand anders er nog meer of andere vindt):
-
Vanwege de grilligheid van economieën;
-
vanwege externe factoren;
-
vanwege versimpelingen in de modellen;
-
en vanwege het feit dat het om macro-economische modellen gaat.
Grilligheid
Een economie is, in tegenstelling tot een slinger, simpelweg een onvoorspelbaar ding. Het gedraagt zich grillig en het is onmogelijk om alle details te kennen die ertoe doen. Eén frauderende werknemer kan een winkelketen failliet doen gaan. Mensen kunnen schrikken en de hand op de knip gaan houden – “Er zal toch geen recessie aankomen? Ik koop maar even niks!” Ook andere bedrijven raken dan in de problemen en voor je ’t weet krimpt de economie een procentje in plaats van dat-ie stijgt. En dat allemaal vanwege één zo’n werknemer. Het is onmogelijk om zoiets te voorspellen.
Externe factoren
Het coronavirus is duidelijk een externe factor waar de modellen geen rekening mee hadden gehouden (wie wel?). Zulke factoren zullen er altijd zijn. Zelfs bij een perfect voorspelbare slinger. Als er onverwacht een vlieg op een slinger gaat zitten zal-ie zich een beetje anders gaan gedragen dan voorspeld. Nogal wiedes. En wat voor slingers telt nog veel meer voor economieën; met veel meer mogelijke externe factoren die van invloed kunnen zijn.
Versimpelingen
SAFFIER gaat ervanuit dat er twee soorten mensen zijn: mensen met vermogen en mensen zonder. De mensen zonder sparen niets en spelen aan het eind van de maand precies quitte. Terwijl de mensen met vermogen dat vermogen tijdens hun pensioen precies opmaken. Dat er ook nog mensen zijn die vermogen nalaten “weet” SAFFIER niet; of dat er mensen zijn die niet quitte spelen, maar schulden maken. SAFFIER zit vol met versimpelingen – zoals alle modellen. Dat was het hele idee van die dingen; ik noemde ze niet voor niets “versimpelende abstracties”. Elk voordeel heb z’n nadeel. Zonder versimpelingen geen model; en met versimpelingen soms een foutje. Tinbergen schreef het in 1936 mooier: “Natuurlijk is elke stylering een waagstuk... Stylering is echter nodig. Het alternatief is onvruchtbaarheid.”
Het betreft macro-economische modellen
SAFFIER is een model in termen van gemiddelden en grote hoeveelheden: de gehele werkloosheid; al het spaargeld bij elkaar etc. Het heet niet voor niets een macro-economisch model. Het idee is dat er relaties tussen macro-economische grootheden bestaan. Als de werkloosheid groot is, dan wordt er meer gespaard; dat soort relaties. Eerder genoemde vergelijking 4.26 drukt zo’n relatie uit. Maar grootheden op macro- niveau hebben helemaal geen directe relatie met elkaar: in die zin dat de ene grootheid niet direct de andere grootheid beïnvloedt.
Ik kan dit illustreren met een bekende relatie in de macro-economie: de relatie tussen inflatie en de hoeveelheid geld die in omloop is.
Deze relatie zit niet in SAFFIER; sterker nog: de financiële sector is niet gemodelleerd in SAFFIER, en er komt überhaupt geen geld in voor, behalve in de vorm van prijzen. Toch kies ik ervoor om mijn punt te maken via de relatie tussen inflatie en geldvoorraad: die is eenvoudig; hij komt veel mensen bekend voor; en het punt dat ik wil maken is algemeen.
Komt er meer geld beschikbaar (hoe dat kan komen laat ik even in het midden), dan worden dingen duurder. Het is een helder verband dat in de geschiedenis steeds bevestigd wordt. Maar... er is helemaal geen direct verband tussen de hoeveelheid geld in omloop en inflatie. In die zin dat geld geen prijsverhoging kan veroorzaken. Zulke macht heeft geld niet. Prijzen worden bepaald door verkopers, en niet door geld.
Het verband tussen inflatie en de geldvoorraad bestaat heus wel, maar er zit een verhaal achter, dat dat verband verklaart. Een mogelijke verklaring in eenvoudige woorden is de volgende: als mensen meer geld hebben, in hun portemonnee of op hun bankrekening, dan gaan ze meer kopen. (Dat is een, naar ik aanneem, herkenbaar psychologisch fenomeen.) Verkopers merken dat aan hun omzet, en realiseren zich dat ze vermoedelijk meer kunnen verdienen door de prijzen wat te verhogen. En voilà.
Dit maakt uit! Zo’n relatie tussen macro-economische grootheden als “de gemiddelde prijs der dingen” en “de totale hoeveelheid geld die in omloop is” is geen directe oorzakelijke relatie; er zit nog verhaal achter. En dat verhaal kan een keertje net iets anders zijn. Als mensen wel meer geld hebben, maar onzeker zijn over de toekomst en als gevolg daarvan niet meer gaan kopen, dan krijg je géén inflatie. En dan is de vermeende relatie tussen prijzen en de hoeveelheid geld er dus plotseling niet.
Dit fenomeen speelt steeds bij macro-economische modellen. Macro-economische grootheden hebben geen directe invloed op elkaar; er schuilt een verklarend verhaal achter; en de relaties tussen zulke grootheden zijn er vaak wel, maar soms ook niet. En dus kunnen voorspellingen, of ramingen, uit de pas lopen met de werkelijkheid.
Kan dit nou allemaal anders? Is het mogelijk iets te doen aan bovenstaande vier oorzaken? Ik denk eigenlijk van niet. Ik zou niet inzien hoe: economieën zijn en blijven grillig - er zullen altijd externe factoren zijn - en zonder versimpelingen geen model. En bij dat laatste fenomeen wil ik nog ietsje uitgebreider stilstaan. Door de macro-modellen van het CPB - en in het bijzonder SAFFIER - te vergelijken met een ander model dat veel aandacht heeft gekregen afgelopen maanden: het epidemiologische model dat de RIVM gebruikt om te voorspellen hoe infecties, zoals corona, zich door de samenleving verspreiden.
Klik hieronder voor de luisterversie:
Het zou goed kunnen dat het model dat het RIVM gebruikt om iets te zeggen over de verspreiding van corona in Nederland het meest bekende wetenschappelijke model van het moment is. Al is het maar omdat de media steevast expliciet over “het rekenmodel” reppen wanneer het over het RIVM en corona gaat. Dat model is het zogenaamde SIR-model met de bekende R0, die idealiter kleiner blijft dan één. Feitelijk gebruikt het RIVM een complexe variant van het SIR-model. En ter herinnering: die R0 staat voor het gemiddelde aantal mensen dat besmet wordt door één zieke. Het SIR-model is net als SAFFIER een macro-model, in die zin dat het niet over individuele gevallen gaat, maar over de besmettingsgraad van de gehele samenleving.
SIR staat voor susceptible, infected en removed, en is een model voor infectieziekten in het algemeen - dus niet alleen voor corona. Het model is gebaseerd op een aantal eenvoudige aannames op individueel (of micro-) niveau: iemand is óf bevattelijk voor de ziekte (susceptible); óf al besmet (infected); óf “doet niet meer mee” (removed). Dat laatste betekent dat iemand de ziekte heeft gekregen en immuun geworden is (of is overleden). Verder wordt aangenomen dat iedereen per tijdseenheid evenveel anderen ontmoet die hij of zij kan besmetten (in ingewikkelder modellen is dit wat subtieler). En dan heb je eigenlijk niet zoveel meer nodig. Slechts nog wat basale kennis over de betreffende ziekte zoals de gemiddelde infectieduur, en dan kun je vanuit de aannames en kennis door louter te redeneren afleiden hoe de ziekte zich in de loop van de tijd zal verspreiden over de populatie.
Net als macro-economische modellen is het SIR-model niet perfect, en heeft het in meer of mindere mate “last” van die eerder genoemde problemen: zo’n infectie kan zich grillig gedragen - één groot feest kan plotseling de infectiegraad doen toenemen. Externe factoren spelen ook hier - als de ziekteverwekker muteert, kan de verspreiding heel anders gaan lopen. En versimpelingen in het model kunnen ervoor zorgen dat voorspellingen niet uitkomen - zoals de versimpeling dat alle mensen evenveel andere mensen ontmoeten. Maar van probleem nummer vier heeft het SIR-model minder last (het probleem dat er achter de verbanden nog een verklarend verhaal schuilt). En dat komt omdat het toch een heel ander model is dan SAFFIER.
Het SIR-model doet voorspellingen op macroniveau, maar wordt afgeleid uit kennis en aannames op microniveau, terwijl SAFFIER direct en alleen maar over grootheden op macroniveau gaat. Je zou het SIR-model kunnen kwalificeren als een bottom-up model (in tegenstelling tot top-down): vanuit micro-aannames (bottom) wordt geredeneerd naar het macroniveau (top). En SAFFIER is dan een top-only model (die term bestond nog niet en heb ik verzonnen voor dit boekje). Ik hoop dat de term duidelijk genoeg is.
Laat ik eerlijk zijn; toen ik me in de macro-modellen van het CPB begon te verdiepen had ik zo m’n bedenkingen. Die beperkte voorspelkracht vond ik nog niet eens het grootste probleem. Maar zo’n brij van vergelijkingen... En dan de manier waarop zo’n model geconstrueerd wordt. Het bouwen van een macro-model schijnt om fingerspitzengefühl te vragen: een intuïtie over welke macro-economische grootheden een betekenisvolle relatie met elkaar hebben. In een historisch overzicht van het CPB uit 2006, over macro-economische modellen wordt gerept over “de kunst van het modelleren”. Dat is eigenlijk best logisch en past bij top-only modellen; als je de relaties tussen macro-grootheden niet kunt afleiden, dan heb je iets anders nodig. Maar ik weet niet of ik fingerspitzengefühl wetenschappelijk erg betrouwbaar vind. Bij het SIR-model heb ik zulke bedenkingen niet. Dat wordt netjes, redenerend “vanaf de bodem” opgebouwd, en het ziet er ook nog relatief elegant uit. Op mij komt dat wat degelijker over.
Ik denk niet dat ik de enige ben. Ik heb er geen studie naar gedaan maar in gesprekken over macro-economische modellen met buitenstaanders - mensen van buiten het CPB - merkte ik vaak soortgelijke bedenkingen. Ook van economen.
En toch, nu ik het allemaal wat beter begrijp, begrijp ik ook dat het niet anders kan. Dat zo’n onelegante, grote verzameling van vergelijkingen vermoedelijk het beste is wat we ooit zullen krijgen. Voetbal heeft me uiteindelijk geleerd waarom.
Klik hieronder voor de luisterversie:
Wetenschap speelt een steeds grotere rol in het voetbal. Trainer en staf hebben natuurlijk kennis en ervaring, maar het is toch plezierig als beslissingen gestaafd kunnen worden met wetenschappelijke inzichten. Daartoe wordt data verzameld: camera’s langs het veld registreren tijdens trainingen en wedstrijden waar iedere speler staat, hoe hard-ie loopt, en welke kant op. Speciale “sport-data-wetenschappers” ordenen de ruwe data en vinden er verbanden in. Feitelijk maakt zo’n data-wetenschapper een model van een voetbalteam: een abstracte versimpeling. En zo’n model bestaat uit verbanden tussen belangrijke gebeurtenissen - zoals het krijgen van een kans, het scoren van goal, en het incasseren van een tegendoelpunt - en bewerkte ruwe meetgegevens. Voorbeelden van zulke gegevens zijn: de gemiddelde positie van alle spelers op het veld (het zogenaamde zwaartepunt van een elftal); de spreiding van de spelers in de lengte van het veld plus haaks daarop; de afstand tussen de zwaartepunten van beide teams.
Zo'n voetbal-model is een macro-model, in die zin dat het niet over individuele spelers gaat, maar over het team als geheel.
Uiteindelijk bestaat zo’n model dan uit vergelijkingen die er in gewone-mensen-taal uitzien als uitspraken in de trant van: “Wanneer de zwaartepunten van beide teams ver uit elkaar liggen, dan is de kans groot dat er binnen een minuut een doelpunt valt.” De trainer kan dit soort kennis gebruiken bij het nemen van beslissingen; over bijvoorbeeld de opstelling, speelwijze en manier van trainen. Zo’n voetbal-model is een macro-model, in die zin dat het niet over individuele spelers gaat, maar over het team als geheel. Bovendien is het, net als SAFFIER, een top-only model: het zijn verbanden op macro- of teamniveau die niet worden afgeleid vanuit een microniveau. En net als bij macro-economische modellen vraagt het construeren van zo’n voetbal-model fingerspitzengefühl: kennis en intuïtie over voetbal-grootheden die zinvol zijn en de verbanden ertussen. Het hele idee dat het zwaartepunt van een voetbalteam een belangrijke grootheid is, is in eerste instantie ontstaan vanuit theoretische overwegingen plus intuïtie. En later is gebleken dat het werkt.
Had dit anders gekund? Is het mogelijk om een voetbalteam-model op te bouwen zoals het SIR-model is opgebouwd? Ik geloof niet dat dat kan; ik zou niet weten hoe. Het is onmogelijk om iets zinvols te zeggen over voetbalteams vanuit slechts kennis over individuele voetballers. Daar is een voetbalteam veel te ingewikkeld voor. Zo’n SIR-model kan vanaf de bodem worden opgebouwd omdat de individuen aldaar zich tamelijk eenvoudig gedragen: ze komen af en toe een ander tegen, en die besmetten ze dan wel of niet. Maar in het voetbal – en ook in een economie – gedragen individuen zich veel complexer: ze lopen naar voren of naar achteren; naar links of rechts; hard of langzaam; met de bal of zonder de bal. Dan kunnen ze nog koppen, dribbelen, passen, op goal schieten en wat al niet. En als klap op de vuurpijl reageren ze ook nog eens op elkaar. Het is onmogelijk om een bottom-up model van een voetbalteam te maken.
Alle bedenkingen die ik had over macro-economische modellen zijn er ook jegens “voetbal-modellen”: ze zijn allesbehalve perfect – er is geen model dat kan voorspellen hoe een wedstrijd zal verlopen; en elegant zijn ze ook niet. En toch vindt niemand dat een probleem. Sterker nog; voetbaltrainers die zulke modellen gebruiken worden gezien als verstandige trainers. Er zijn twee opties: of de club maakt slechts gebruik van de kennis en kunde van de trainer plus de staf; of de bevindingen van het model worden ook gebruikt. Optie twee is toch best verstandig.
Ik geloof dat ik om ben. Ik vind het volkomen helder waarom voetbal-modellen zijn zoals ze zijn; en ik realiseer me dat het moeilijk anders kan. Ik weet dat ze hun beperkingen hebben, maar ik vind het desalniettemin verstandig ze toch te gebruiken. En als ik dat van voetbal-modellen vind, dan moet ik dat toch ook vinden van SAFFIER? – en soortgelijke macro-economische modellen.
Klik hieronder voor de luisterversie:
Naast SAFFIER gebruikt het CPB nog andere modellen (zoals eerder genoemde EMU, TAXUS en MICSIM). Maar deze modellen zijn toch wel heel anders dan SAFFIER. (En onderling zijn ze ook nogal verschillend.) EMU gaat over de overheidsuitgaven; TAXUS over door de overheid te ontvangen belastingen en beide zijn het een soort omvangrijke boekhoudpakketten. MICSIM is interessant omdat het wel wat weg heeft van het SIR-model, in die zin dat het een bottom-up model is, of in economische terminologie een “micro-macromodel”.
MICSIM is een heel specifiek model – in tegenstelling tot SAFFIER. Het modelleert het effect van bepaalde belastingen en toeslagen op het “arbeidsaanbod” (het aantal mensen dat wil werken, en het aantal uren dat ze dat willen). MICSIM kan antwoord geven op vragen als: “Gaan ouders van jonge kinderen meer werken als de kinderopvangtoeslag omhoog gaat?” Dat doet MICSIM niet via verbanden op macroniveau, maar door beslissingen van individuen te simuleren.
Individuen maken in MICSIM een tamelijk eenvoudige keuze: ze kiezen het aantal uren dat ze willen werken, en ze kiezen het aantal uren kinderopvang (allicht nul voor mensen zonder kinderen). Dat is het; meer doet een individu in MICSIM niet. Bij iedere combinatie van uren hoort een inkomen en horen kosten. Persoonlijke voorkeuren variëren - de één hecht meer waarde aan werk, en de ander vindt het fijner om veel met de kinderen te zijn - maar iedereen wordt verondersteld een rationele keus te maken die het best past bij die voorkeuren. MICSIM simuleert duizenden individuen die wat betreft leeftijd, type gezin, uurloon en voorkeuren representatief moeten zijn voor Nederland. En kan zodoende ramen wat er met het arbeidsaanbod gebeurt als belastingen of toeslagen veranderen. (Overigens heeft MICSIM wel wat van het modelautootje dat ik eerder beschreef: zo’n autootje is een verkleining van een echte auto waarin details zijn weggelaten. Dat is MICSIM ook: een gesimuleerde samenleving in het klein, met niet miljoenen, maar met duizenden individuen die ook nog eens sterk versimpeld zijn.)
MICSIM is echt een heel ander model dan SAFFIER, en de vraagt rijst of het niet mogelijk is om op eenzelfde manier een macro-economisch model te bouwen van de gehele Nederlandse economie. Simuleer honderdduizend Nederlanders in hun economisch gedrag, en je weet hoe Nederland er over een tijdje voorstaat. Maar dit gaat niet werken. Als het om werk gaat, dan is het gelegitimeerd om een individu te versimpelen tot iemand die uit een paar opties kan kiezen. Maar als het om alle economische handelingen gaat, dan is zo’n versimpeling niet mogelijk, of misschien beter: niet zinvol.
In de voetbal-analogie zou dat op het volgende neerkomen: “Laten we veronderstellen dat een speler kan stilstaan en kan rennen; en dat-ie naar voren kan lopen en naar achteren. En laten we dan eens kijken wat er gebeurt als we 22 van zulke spelers gaan simuleren; misschien leert het ons iets over voetbal.” Niet dus. Dat gaat niet werken. Voetballers doen verschrikkelijk veel meer dingen, en hebben bovendien ingewikkelde onderlinge interacties; het zou onzin zijn een voetballer zo te versimpelen. Idem voor mensen in een samenleving.
Het CPB gebruikt meerdere modellen, die onderling flink verschillen. Maar het “model-model” blijft voor mij SAFFIER, dat de complete Nederlandse economie probeert te modelleren, en dat een directe voortzetting is van het werk en de ideeën van Jan Tinbergen. Ik schreef dat ik “om ben”: ik vind het logisch dat SAFFIER de vorm heeft die het heeft, en ik denk niet dat het op een heel andere manier veel beter kan. Toch kan ik me heus wel voorstellen dat bepaalde dingen anders kunnen. Zo kan ik me bijvoorbeeld goed voorstellen dat het mogelijk is om met kunstmatige intelligentie economische modellen te bouwen. Op dit moment is het zo dat het construeren van macromodellen om economische kennis en inzicht vraagt. Zo’n model begint met de veronderstelling dat er bepaalde relaties bestaan tussen economische grootheden - op basis van inhoudelijke overwegingen. Daarna wordt gekeken in beschikbare data of die relaties plausibel zijn, en wat dan de parameters van de veronderstelde relaties zijn (hoe groot is het effect van het een op het ander, en hoeveel tijd gaat eroverheen voordat effecten optreden).
Het is niet zo dat zo’n relatie voor honderd procent uit de data blijkt: eerst is er een veronderstelde relatie, en daarna wordt die relatie met behulp data bevestigd en gepreciseerd. Dat kan tegenwoordig anders. Met kunstmatige intelligentie technieken is het mogelijk om automatisch verbanden in data te vinden. Het kan goed zijn dat zulke technieken vreemde en onzinnige verbanden vinden, maar het kan ook goed zijn dat ’t juist ware, relevante verbanden zijn waar gewone stervelingen overheen kijken. Wetenschap is vaak tegen-intuïtief, en het is best denkbaar dat er nog onbekende macro-economische relaties zijn die heel relevant zijn. Kunstmatige intelligentie kan helpen zulke relaties te vinden.
Een door kunstmatige intelligentie gebouwd model dat onbegrijpelijk in elkaar zit, maar wel goed werkt. Gaan we dat gebruiken?
Het nadeel van deze aanpak is wel dat we dan vermoedelijk in een theoretische discussie belanden die ook al speelde in de tijd van Tinbergen: is een model er om een goede raming te maken? Of is een model er om ons te helpen beter te begrijpen hoe de economie in elkaar zit? Tinbergen was pragmatisch en vond dat modellen vooral moesten werken. Ik schat in dat hij voor optie één zou gaan. Bovendien waren de modellen in zijn tijd dermate overzichtelijk dat ze altijd wel bijdroegen aan begrip. Maar dat is anders bij een door kunstmatige intelligentie gebouwd model dat zeer ingewikkeld en feitelijk onbegrijpelijk in elkaar zit, maar wel goed werkt. Gaan we dat model vertrouwen en gebruiken of niet? Maar vooralsnog is dit een hypothetische discussie.
Er is overigens nog één vraag die ik niet beantwoord heb, terwijl ik dat wel beloofd had: “Waarom moeten die modellen regelmatig worden bijgesteld?” Maar ik denk dat ik tussen de regels door het antwoord wel gegeven heb. Modellen zijn gebaseerd op een mix van inhoudelijke, economische overwegingen plus statistische gegevens. Vooral die laatste zijn aan verandering onderhevig. Als mensen tegenwoordig bijvoorbeeld vaker beleggen dan vroeger, dan zou dat wel eens gevolgen kunnen hebben voor parameters in sommige vergelijkingen; en dan moeten die dus worden bijgesteld. Dat is geen teken van zwakte.
Klik hieronder voor de luisterversie:
Terug naar de vraag waarmee ik begon: Wat willen die lui? Wat wil men daar bij het CPB? Mijn antwoord luidde: De overheid helpen om gedegen beleidsbeslissingen te nemen, op basis van inschattingen die gefundeerd zijn in wetenschap. Dat lijkt me een verstandige agenda.
Ik merk die agenda ook wanneer ik rondloop op het CPB en daar mensen spreek. Het zijn slimme economen die oprecht hun wetenschappelijke kennis in proberen te zetten ten behoeve van de samenleving. Ik vind het “samenlevingsingenieurs”: zakelijke lieden die hun kennis en kunde niet inzetten voor het doorrekenen van een brug of gebouw, maar voor het doorrekenen van beleidsbeslissingen, opdat deze beslissingen zo goed mogelijk genomen worden. De econoom Paul Samuelson heeft ooit over het economische vakgebied gezegd dat het hard en zakelijk is over zachte en wezenlijke dingen. En dat is precies wat ik bij het CPB ervaar.
Toch wil ik dat grafiekje uit 1936 er nog eens bijhalen. Dat grafiekje dat me het antwoord gaf op de vraag wat die lui bij het CPB toch willen. Verticaal staat de geraamde werkgelegenheid bij verschillende overheidsmaatregelen. Die werkgelegenheid schommelt tussen de -22 procent (ten opzichte van een door Tinbergen veronderstelde normale werkgelegenheid) en de +10 procent. Dat zijn nogal verschillen. Ik kan me nauwelijks voorstellen dat de huidige reële opties voor beleid zulke grote verschillen teweeg brengen. Doet de overheid het ene, dan is de geraamde groei 1,0 procent; en bij het andere is het 1,1. Bovendien zijn die percentages omgeven door flinke onzekerheden. Een groei van 1,0 procent betekent vermoedelijk plus of min een flinke marge, en dan is het verschil met 1,1 wel heel erg klein. Ik weet, kleine verschillen tellen op en worden grote verschillen na een aantal jaren, maar zo groot als in die ene grafiek uit 1936 zie ik niet zo snel gebeuren. Een nadeel van de kwantitatieve, wetenschappelijke aanpak wordt direct duidelijk: je loopt het risico je te verliezen in cijfermatige details en de grote, wezenlijke dingen die misschien minder meetbaar zijn, te vergeten. Dit is een makke van de rationele ingenieursaanpak.
Het gaat natuurlijk niet om een groei van het bruto binnenlands product van één of twee procent. Het gaat erom hoe mensen hun leven ervaren. Of dat plezierig is en misschien zelfs een beetje beter dan vorig jaar. Maar dat is moeilijk in een nummertje te vatten, en dan richt je je dus maar op dat bruto binnenlands product. Ik weet niet of het oplosbaar is. Aan de ene kant is het logisch en verstandig je te baseren op ratio en cijfers, en andere kant loop je dan het risico de dingen die er echt toe doen uit het oog te verliezen. Ik geloof dat ze dit risico bij het CPB wel kennen. Daar begrijpen ze goed dat het verschil tussen 1,0 en 1,1 niet zo groot is, en dat welzijn niet hetzelfde is als welvaart, laat staan te vatten in een cijfer. Ik hoop dat men het elders evengoed begrijpt.
Hoe dan ook... ze doen daar bij het CPB verstandige dingen. Met een oprechte en maatschappelijke intentie. En op een manier die vermoedelijk niet veel beter kan. Ik realiseer me dat ze er nog veel meer doen dan slechts het maken en “draaien” van modellen. Ze maken er ook analyses en rondom de output van een model wordt altijd sowieso een heel rapport geschreven. Maar omdat die modellen zo kenmerkend zijn voor de geschiedenis van het CPB heb ik vooral daar de nadruk op gelegd. Dat leek me wel zo leuk voor een verjaardag.