Angst, minimax en koude oorlog
door J. Pen
voor B.R.
1
Het leven is vol onzekerheden en kwade kansen. Dat kan nu eenmaal niet anders, omdat de omstandigheden waaronder de mens gedijt zo uiterst speciaal zijn; de kleinste afwijking daarvan geeft al gauw toestanden die met het leven minder goed en of helemaal niet verenigbaar zijn. Wij worden bovendien omringd door tegenspelers, lepe rakkers veelal, die onze zwakke zijden in de gaten hebben en daaruit profijt trekken; en ook als de aanwezigheid van deze tegenstanders in twijfel kan worden getrokken, menen we hen soms toch te zien. (Vaak zien we dan trouwens niet veel anders dan onszelf.) Het is, volgens sommigen, een onvriendelijke wereld, die een flinke dosis angst rechtvaardigt. Anderen denken daar bij voorkeur anders over; zij bekijken de natuur en de medemens met vriendelijker en argelozer ogen, maar kunnen toch onguurheid, en boosheid en dus ook de angst niet helemaal wegcijferen. Er zijn trouwens duidelijke gevallen waarin, overdreven gezegd, het brood van de een de dood is van de ander. De geringe vrolijkheid der hedendaagse internationale betrekkingen heeft de potentiële aanwezigheid van conflicten geaccentueerd.
De vraag rijst, hoe daarop te reageren. Het beste is natuurlijk, te doen alsof men van niets weet en rustig het eigen tuintje bij te harken. Maar sommigen verkeren niet in zo’n prettige positie. Zij moeten erop uit in het vijandelijke leven en trachten de concurrenten, of de collega’s die óók hogerop willen of de examinator, of de politie, of de oppositie, of de sabeltandtijger, of de Indonesiërs, of de Russen te vlug af te zijn. Een argeloze levenshouding zou in deze gevallen licht
kunnen leiden tot nederlagen, die de argeloosheid des te wreder verstoren.
Een meer uitgekiende gedragslijn ligt daarom voor de hand. Met dit uitkienen, maar dan in abstracto, heeft de wetenschap zich nu bijna twintig jaar intensief bezig gehouden. Daarbij was het spel uitgangspunt: daar bestaat immers een wezenlijke tegenstelling tussen opponenten, die door geen harmonie wordt verzacht. Bij schaken en bamzaaien wint de een, de ander verliest. Rond de pokertafels van Princeton zijn ideeën uitgewerkt, waaromtrent een omvangrijke literatuur is ontstaan, bekend als: speltheorie. De techniek ervan is in eerste aanleg nogal wiskundig, doch dat hoeft geen beletsel te zijn voor wie met een algemene indruk wil volstaan en daarna liever nadenkt over de maatschappelijke en psychologische kanten van strijdsituaties. Vooral de minimax-positie, kern van de eenvoudige speltheorie, heeft genoeg opmerkelijke aanknopingspunten met dagelijkse dingen om er eens even bij stil te staan. Dat is dan de bedoeling van deze aantekeningen, waarbij vooral de koude oorlog als een soort illustratie wordt gebruikt. Het vreemde noodlot, dat de wereld in zijn greep houdt, kan door de speltheorie nog eens opnieuw worden belicht.
Voor wie geïnteresseerd is in de geschiedenis der leerstellingen, in namen en in boeken: de theorie der spelen had vanouds de aandacht van wiskundigen. De zeventiende eeuwse Chevalier de Méré, gehinderd door zijn voortdurend verlies bij het dobbelen, legde zijn moeilijkheden voor aan B. Pascal, waaruit de waarschijnlijkheidstheorie ontstond. Naderhand hield D. Bernouilli zich bezig met de vraag, hoeveel een dobbelaar er voor over mocht hebben om aan een bepaald spel mee te doen; daar werd het begrip ‘nut’ geboren, dat vele economen nog uitermate na aan het hart ligt. (Hierna zullen af en toe getallen ten tonele worden gevoerd, die min of meer bedoeld zijn als indicaties van het ‘nut’, dat een bepaald spel voor de partijen bij een bepaalde uitslag oplevert.) Deze oude theorieën hadden echter steeds betrekking op hetgeen er gebeurt als er vele malen achtereen met dobbelstenen wordt gegooid. Er traden geen bijzondere unieke gebeurtenissen op, geen zetten die op hun beurt unieke tegenzetten uitlokken. De ‘strategische spelen’, waarbij dat wel het
geval is, zijn eerst in de twintigste eeuw nader bekeken. De wet van de grote getallen is daarbij primair niet in het geding. Veeleer gaat het om de reacties, die iemands zetten bij de tegenpartij uitlokken. Zo in de geest van: ‘als ik dit doe, doet hij dat’. De grote pionier is J. von Neumann, het standaardwerk: de ‘Theory of Games and Economic Behavior’ dat hij samen met O. Morgenstern schreef. Sinsdien is er een stroom van boeken en artikelen losgekomen.1)) In 1959 constateerde Morgenstern, dat hij duizend van die publicaties in handen had gehad.
2
De betrekkingen tussen twee personen kunnen gemakkelijk vastvriezen in een minimax-positie. Dat is een onbehaaglijke gedachte. Zij kan alleen worden toegelicht als de lezer bereid is, even een didactisch betoogje te volgen.
Stel dat er tussen de spelers A en B een spel aan de gang is van het genre als-ik-dit-doe-doet-hij-dat. Iedere speler doet één zet en heeft de keus uit drie mogelijkheden. De uitslag bij iedere combinatie van zetten is bekend. Deze uitslag bestaat in een bepaalde verdeling van de pot, die op 100 wordt gesteld. Er zijn dus negen getallen, die de eventuele afloop weergeven. Zij kunnen worden samengevat in een lijstje, matrix genaamd; deze matrix is het uitgangspunt voor bijna alle speltheorie. De boeken staan er vol mee. A’s alternatieven zijn onder elkaar gezet; het zijn regels of rijen. B kiest uit de kolommen.
Omdat A en B in ons geval in totaal 100 winnen, kan de matrix in ieder vakje één getal bevatten, dat bijvoorbeeld de winst van A weergeeft. (Die van B is dan 100 minus dit
cijfer.) Een dergelijke matrix heet een ‘constante-som spel’; een puur conflict blijkbaar. Bijvoorbeeld:
B1 | B2 | B3 | |
A1 | 100 | 10 | 0 |
A2 | 40 | 35 | 30 |
A3 | 60 | 50 | 20 |
Dit wil dus zeggen, dat als A zet no. 1 doet, en B daarop reageert met zet no. 1, A de gehele pot wint. Reageert B, wat slimmer is, met zet no. 3 dan krijgt B de gehele pot. Waarom? Daarom. Omdat ik deze getalletjes nu eenmaal zo heb ingevuld. ‘t Is maar een voorbeeld, met de bedoeling de minimax uit te leggen. A en B kennen deze tabel zo goed als u en ik, is de veronderstelling.
A mag eerst. Kiest hij zet no. 1 dan is hij de sigaar; B zal antwoorden met no. 3, en winnen. Kiest A no. 2, dan zal B ook no. 3 kiezen, en de uitslag is 30-70 in het nadeel van A. Kiest A no. 3 dan doet B hetzelfde en de uitslag is 20-80 in het nadeel van A. De minst slechte keuze voor A is dus no. 2, waarop B reageert met no. 3. Het resultaat is A2 B3. Dit noemt men de minimax.2)) Opvallend is, dat dezelfde uitslag wordt bereikt als B eerst mag kiezen, en daarna A. Beide partijen sturen op dit punt af. Het geeft dus een stabiele uitslag van het spel weer.
Nadere beschouwing van de matrix leert dat deze stabiele uitslag kan worden bescheven als het minimum van een rij
(horizontaal) en het maximum van een kolom (verticaal). Dat is inderdaad de definitie van de minimax.
Wie niet van willekeurige getalletjes houdt, en liever denkt in algemener termen van meetkunde in de ruimte kan zich de matrix als volgt voorstellen. In ieder vakje wordt een berg opgeworpen, waarvan de hoogte correspondeert met de betrokken uitslag. Iedere rij of kolom wordt daardoor een soort bergrug. A kiest de rug waarin de laagste berg het hoogste is. B kiest de rug, waarin de hoogste berg het laagste is. Voor bergbeklimmers: beiden kiezen de top van een pas.
Een paardenliefhebber ziet misschien meer in het volgende beeld: als hij zijn hand op de flank van het paard legt, ergens achter de schouder, en hij laat de hand dan langs het dier omhoog klimmen, bereikt hij het hoogste punt op wat ik nu maar de ruggegraat zal noemen. Streelt hij het beest over de (enigszins holle rug) dan ontmoet hij hetzelfde punt als de laagste plaats; daar komt het zadel op te liggen. De minimax wordt daarom ook wel zadelpunt genoemd. Naar het schijnt kan een ruiter ter plaatse stevig zitten. Hij hoeft niet zo erg bang te zijn om in het zand te bijten.
3
Het zadelpunt is manna voor de wiskundigen, maar hun geestelijke oefeningen gaan ons nu niet aan. Het vormt voorts de steen der wijzen in bepaalde situaties des levens, namelijk waarin iemand oog in oog staat met een uitgekookte tegenstander – eventueel het noodlot – die feilloos de achillespees weet te vinden. Het hoeft daarbij geenszins zo te zijn, dat het spel de vorm aanneemt die wij beschreven: A doet eerst een zet, dan B. Het kan ook zijn, dat A en B gelijktijdig hun keuze bepalen, mits deze keuze telkens terugkeert en de matrix bekend is. Er valt een formeel bewijs te leveren, dat onder die omstandigheden het zadelpunt het enige stabiele resultaat vormt, indien partijen althans hun eigenbelang op de juiste wijze dienen. Zij raken dan in de greep van de minimax, al zou men ook kunnen beweren, dat zij in de greep van de vijand zijn geraakt, of in die van het noodlot. Tegenspartelen helpt niet; het maakt de afloop alleen maar slechter voor de spartelaar.
De beperktheid van het minimaxgedrag schuilt hierin, dat het een concentratie op de noodtoestand betekent. Men kiest de slechtste reeks en maakt daar het beste van. Zulks corres-pondeert met een bepaalde psychologische instelling: een drang naar veiligheid in een klein hoekje; of de neiging, de tegenstanders en Het Leven als angstaanjagend te beschouwen. De feitelijke afloop van de minimax-keuze behoeft niet per se ongunstig te zijn; dat hangt van de matrix af. Iemand kan in zijn zadelpunt fifty-fifty spelen met het lot, of nog beter. Maar de uitkomst is welomschreven en geborneerd. Sommigen zullen het een burgerlijke gedragslijn noemen.
Tegenover een geduchte en helderziende opponent valt dus niet aan de minimax te ontkomen. Maar het kan gebeuren, dat de tegenstander wordt overschat, en dat iemand het zadelpunt kiest zonder dat de bijpassende uiterlijke situatie daartoe dwingt. Dan wordt de strijd te vroeg opgegeven. Bangelijkheid kan leiden tot het teloorgaan van grootser mogelijkheden. Wie te angstig is laat zich door concurrenten, leveranciers, klanten, bazen, buren, de publieke opinie, in een minimax duwen zonder dat de speltheoretische noodzaak daarvan voorhanden is. De oorzaak ligt dan bij iemands psychologische instelling. Hij levert zwak tegenspel, maar misschien kan hij niet anders.
Deze zwakheid kan aan de hand van een matrix worden toegelicht. Wij gaan er nu van uit, dat de getallen niet precies bij de spelers bekend zijn; zij hebben er slechts zekere vermoedens over. Hun gedragslijn ligt dus niet geheel vast. Neem aan, dat de uitkomsten in feite zijn
80 | 10 | 80 |
80 | 10 | 80 |
12 | 11 | 12 |
Nu kan A de onderste rij kiezen omdat deze hem, in het slechtste geval, nog juist een iets beter resultaat lijkt te geven dan de andere rijen. Maar hij verspeelt dan de kans op het cijfer 80 die aanwezig is ingeval B zich vergist. Terwille van één punt verschil offert de bangerd bijna zeventig punten op. De minimax is hier voor A alleen aangewezen, als hij
zeker weet dat de vijand hem in de zwakke zijde zal tasten. Heerst er enige onzekerheid, dan kan hij, als hij ook maar even flink is, no. 1 of no. 2 kiezen.
De speltheorie heeft getracht, onzekerheden te reduceren tot enkelvoudige getallen door aan elk vakje van de matrix een waarschijnlijkheid toe te kennen, en deze met het in dat vakje voorkomende cijfer te vermenigvuldigen. Zo ontstaat een nieuwe matrix, zonder enige vaagheid. Maar tegen deze procedure bestaan bezwaren; in casu wordt de toepassing van numerieke waarschijnlijkheden op unieke gebeurtenissen door sommigen ontoelaatbaar geacht. Het strookt ook meer met de psychologische werkelijkheid om onzekerheden als zodanig te beschouwen, en ze niet te transformeren in gefixeerde getallen.
Hoe dit ook zij, het hierboven aangeduide geval is duidelijk. Maar het is niet extreem. Het zadelpunt vormt misschien geen tastbare misgreep. Maar neem nu eens in gedachten, dat iemand zijn leven op duizend manieren kan inrichten. Iedere manier kan weer op duizend manieren uitvallen, allemaal even prachtig (waardering 100 punten). Het noodlot heeft echter één variant achter de hand, waarop er van al deze duizend manieren niets terecht komt (resultaat: 1 punt). Daar staat tegenover, dat er één manier van doen is, die altijd een resultaat van twee punten oplevert, en als het noodlot de duizendeerste tegenzet kiest, een resultaat van 3 punten. Volgens de minimax is onze man op deze laatste keuze aangewezen, waarmee het leven, met zijn miljoen mogelijkheden, eigenlijk aan hem voorbijgaat.
Hij moet dus al een angstige pessimist wezen als hij deze minimale mogelijkheid uitkiest. Bovendien zal hij dan een uiterste aan wijsheid moeten ontplooien om in zijn kleine hoekje niet verbitterd te raken; want hij heeft tenslotte geen zekerheid dat alles niet veel beter gelopen was als hij op wat stoutmoediger wijze het lot het hoofd had geboden. Maar het kan ook zo uitvallen, dat veilig spel het enige is, dat bij zijn psychologie past. Dan moet hij stil blijven zitten, zijn kleine genoegens savoureren en de toppen des levens laten voor wat ze zijn, tevreden in het besef van zijn relatieve onkwetsbaarheid. Hij verkeert niet langer in de greep van de minimax, doch is er in geslaagd de minimax aan zijn levensstijl
dienstbaar te maken. Hij heeft het leven onder de knie. Zulks kan, maar er hoort wijsheid toe.
4
Niet alle levenssituaties vertonen een zadelpunt. Het is gemakkelijk een lijstje getallen op te schrijven waarin geen minimax voorkomt. De speltheorie raakt hier, op ‘t eerste gezicht, in verlegenheid. Von Neumann heeft echter reeds in 1928 ontdekt, dat ook dan een bepaalde strategie denkbaar is, die tot een resultaat voert met alle eigenschappen van de minimax. Die gedragslijn, ‘gemengde strategie’ geheten, gaat op in de gevallen, waarin de pot, die beide spelers te verdelen hebben, constant is. Haar uit te leggen zou voor ons doel nauwelijks de niet onaanzienlijke moeite waard zijn.
Wat wel de moeite waard is: een nadere beschouwing van situaties, waarin de pot varieert. Een zgn. constant-sum game, dat we hierboven op het oog hadden, houdt een zuiver conflict in. Wat de een wint, verliest de ander. Dat geldt a fortiori van de ‘zero-sum games’ die trouwens in wezen van de ‘constant-sum games’ weinig verschillen. De praktijk geeft echter vele, en uiterst belangrijke, gevallen te zien waarin het conflict niet puur is, doch gemengd met harmonie.3)) De tegenstanders kunnen dan samen veel winnen, of veel verliezen, zij het niet oneindig veel en zij het ook, dat de buit in de verschillende gevallen verschillend wordt verdeeld. Het gevaar dreigt nu, dat zij het conflictueuze aspekt laten overheersen, en in pseudo-zadelpunten worden gedreven die niet bij de fundamentele situatie passen. Zij doen daar geen goed aan, al brengen de regels van het spel deze gedragslijn soms mee. Deze concentratie op de noodtoestand is een van de noodlottige en tragische facetten van de koude oorlog. Dat is dan ook een kwalijk spel.
Het lijdt geen twijfel dat, zakelijk gezien, in de verhouding tussen West en Oost de belangengemeenschap overheerst. Het gemeenschappelijke belang ligt primair bij het voorkomen van de atoomoorlog en bij het verhinderen van ato-
maire plannen van derde landen – ik noem geen namen van crapuleuze en bloeddorstige regeerders die ongeduldig zitten te wachten tot ook zij met de bom kunnen dreigen, hoewel tenminste een van die namen mij op de lippen brandt. De blokken hebben verder een gemeenschappelijk economisch belang bij ontwapening, op zichzelf significant genoeg al verbleekt het bij de eerstgenoemde vorm van harmonie. Belangentegenstellingen tussen West en Oost ontbreken niet, maar zij zijn nogal fictief, voor wie erover nadenkt, en veeleer gevolg dan oorzaak van de koude oorlog. Economische twistpunten bestaan nauwelijks, behalve als speldeprikken in de bestaande strijd. De concurrentie om de ‘neutralen’ is een strijd om de macht, die alleen zinvol is zodra men uitgaat van een bestaand conflict. Het is het politieke a priori dat de wereld gescheiden houdt, geen harde belangentegenstelling. En in feite overweegt de harmonie, al handelt men daar niet naar. De speltheorie kan dit laatste verklaren.
De matrix is onder die omstandigheden iets ingewikkelder dan die welke boven werd beschreven. In ieder vakje staan twee getallen: het eerste geeft het resultaat voor A weer, het andere het resultaat voor B. Er zal in het algemeen geen zadelpunt in zitten, want dat typeert slechts de constante-som spelen.
Zoals gezegd is een van de tragische aspecten van de koude oorlog, dat de landen zich vrijwel uitsluitend bezighouden met hun conflictsituatie, en de toch in het oog springende belangengemeenschap verwaarlozen. Zij trachten zich in te dekken tegen de slechtst denkbare eventualiteiten: een minimaxachtige gedragslijn. Maar de theorie van het zadelpunt kan hierop toch niet worden toegepast. Want de narigheid van de koude oorlog is, dat er niet noodzakelijkerwijs een minimax in voorkomt. De situatie is erger.
5
Neem een ouderwetse bewapeningswedloop; ‘ouderwets’ in de zin dat er met de dreigende oorlog geen totale vernietiging is gemoeid, en dat de angst binnen de perken blijft. Als beide landen zich van bewapening onthielden zouden zij ieder in een (economische) situatie verkeren die we waar-
deren met het cijfer 100; alle produktiemiddelen worden bestemd voor vredelievende doeleinden. Dit is de linkerbovenhoek van de matrix.
B kan zijn positie versterken door te bewapenen mits A het niet doet; stel dat het machtige land B economische voordelen op het machteloze land A kan behalen, die een resultaat opleveren van 200, terwijl A in een verliessituatie (-200) verkeert. Dit is de rechterbovenhoek. Linksonder geeft het omgekeerde geval weer. Kiest een land bewapening als tegenzet tegen de dreiging dan lijdt het schade, doch deze is veronderstellingsgewijs kleiner dan wanneer het was onderworpen. Deze constellatie maakt de eenzijdige bewapening onstabiel; alleen de tweezijdige bewapening is een houdbare positie. Deze heeft echter de onaangename eigenschap, van kwaad tot erger te geraken. Noem de uitslag daarvan voor allebei – 100.
De matrix ziet er dan bijvoorbeeld als volgt uit:
+100, +100 | -200, +200 |
+200, -200 | -100, -100 |
Blijkbaar is de som der uitslagen in iedere situatie verschillend, te weten
200 | 0 |
0 | -200 |
De tragiek van het geval is nu, dat B, door kortzichtigheid, van links naar rechts wordt gedreven en A van boven naar beneden. De uitslag ligt rechtsbeneden. Als we vier posities weergeven door de hoekplaats van een vierkant, en de richting van het proces door pijlen zien we dit:
Het systeem drijft, zoals bekend, naar een verliessituatie voor beide landen, en tot een kleiner totaal. De oorzaak ligt nu niet bij de minimax, want die is er niet: doch bij egoïsme en kortzichtigheid. Het moet in deze situatie mogelijk zijn, een weg te vinden, die van rechtsonder naar linksboven leidt, langs de gestippelde diagonaal. Het vinden van de diagonaal is des te urgenter omdat de positie rechtsonder in zichzelf onstabiel is en een verdere wedloop op gang brengt. Deze wedloop kan opnieuw door de speltheorie worden beschreven: een keten van vierkantjes in zuidoostelijke richting. (Een andere methode is die van de fysicus L.F. Richardson, vader van de conflictologie: hij gebruikt de klassieke wiskunde der differentiaalvergelijkingen. Naar hem wordt de wedloop wel eens Richardson-proces genoemd. Dit is dus geen speltheorie.)
Het cumulatieve proces maakt het vinden van de diagonaal, die naar het noordwesten wijst, moeilijker en tevens urgenter. Deze diagonaal is immers niet impliciet in het proces, maar moet langs andere weg worden gevonden: communicatie, redelijkheid; internationale organisatie; een nieuw volkenrecht. Wij kennen het doel: de situatie links boven, maar niet de weg erheen. Daar ligt dus een typisch terrein braak voor de wetenschap. Het is de taak van de polemologie, de omstandigheden te bestuderen die de naar het noordwesten wijzende diagonaal in het leven kunnen roepen. Deze taak is echter zwaarder dan de matrix suggereert; onze redenering houdt nog geen rekening met de kernwapens en met de daardoor veroorzaakte angst.
6
Alvorens verder te gaan moet een tegenwerping worden weerlegd. Ik kan mij voorstellen, dat sommige lezers deze voorstelling van zaken nogal kinderachtig en weinig behulpzaam vinden. Er komt iets uit dat wij al wisten, en er wordt bovendien van alles en nog wat verdonkeremaand: de sociologie van het geval, de ideologische tegenstellingen, het bewuste dreigen, de morele kant, het smoel van de heer Chroestjow dat ons aan zijn bloederige verleden herinnert. Deze onvolkomenheden kleven inderdaad aan de speltheorie,
maar de vierkantjes zijn toch niet zo onvruchtbaar als ze hierboven misschien lijken. Er kan mee geëxerceerd worden op een manier, die uitgaat boven het simpele voorbeeld.
Zo kan men laten zien, dat bij enigszins andere gekozen getalsverhoudingen het proces anders verloopt dan de noodlottige drift naar de rechterbenedenhoek. Stel, dat land A de situatie van ontwapening waardeert met 900, B met 100; dat de eenzijdige bewapening van B een verhouding 800, 0 schept; de eenzijdige bewapening van A een verhouding 700, 200; en de tweezijdige bewapening, die in het nadeel is van B: 800, -100. Dan ziet het proces er als volgt uit (wie het niet gelooft mag het narekenen, of er een boek4)) op naslaan):
Dat wil zeggen: geen enkele positie is stabiel; er gaan golven van be- en ontwapening door de wereld.
Zo kan men ook de eenzijdige ontwapening beredeneren; zij wordt weergegeven door een vierkantje, waarin alle pijlen gericht zijn naar rechtsboven of naar linksonder. Dit doet zich voor, als de rechterbenedenhoek voor een van beide partijen een slechtere uitkomst oplevert dan rechtsboven of linksonder. Een dergelijk geval is uit de sociale geschiedenis zeer bekend: de positie van slaven, vrouwen, boeren, arbeiders en andere verworpenen der aarde werd gekenmerkt door een dergelijke matrix. De pacifisten zijn van mening, dat het Westen thans in die situatie verkeert, en dat alleen misverstanden, kwade bedoelingen van pressiegroepen, een geknevelde pers, dit versluieren. Anderen zien dit anders, en verkiezen de rechterbenedenhoek boven noordoost en zuidwest,
omdat zij bang zijn (en wellicht met reden). Vrijwel iedereen, en stellig ieder zinnig mens, ziet de linkerbovenhoek als preferabel boven alle andere situaties, maar juist dit hoekpunt is voorshands nog een onbereikbaar ideaal gebleken.
Tenslotte is ook een geval denkbaar, waarbij alle pijlen linksboven samenkomen. Dat is de harmonie zonder neiging tot bewapening: de mooie toestand die tussen de V.S. en Canada bestaat. Een dergelijke constellatie heeft overigens reeds sinds de 18e eeuw de aandacht getrokken dergenen, die het economisch leven beschouwden als een samenspel van individuen, die ieder op eigenbelang uit zijn en zodoende het algemeen belang dienen omdat het marktmechanisme hun handelingen tot een zinvol geheel coördineert. Dit is het beeld van de Grote Harmonie.
De speltheorie kan voorts helpen om de stabiliteit te analyseren van de relaties tussen drie partijen. Dan ontstaan geen driehoeksverhoudingen, zoals men misschien zou denken, maar twee in elkaar geschoven vierkanten. De pijlen volgen ingewikkelde wegen. De bestudering ervan is alleen geschikt voor volhardende puzzelaars. Ik wil maar zeggen, dat deze techniek, hoewel in vele opzichten te mager om de realiteit van de menselijke betrekkingen weer te geven, toch een zekere orde kan scheppen in het denken, en daardoor iets meer helderheid kan brengen op plaatsen waar nu nog schemer heerst.5)) Er komt nooit iets anders uit dan men er in stopt; maar wij weten niet steeds wat we in onze redeneringen stoppen. Zulks is speciaal in de economie gebleken: de speltheorie werd met succes toegepast op de strijd om de markt, waarbij een interessante systematiek van de concurrenten naar voren kwam. (M. Shubik). Daar wil ik het echter niet over hebben. De sceptici zij slechts voorgehouden, dat de sociale wetenschappen en ook de polemologie de speltheorie niet mogen versmaden.
7
De atoombom heeft een nieuwe matrix doen ontstaan, waarin de zuigkracht van de rechterbenedenhoek enorm is toegenomen. Kernbewapening door B brengt A’s cijfer, rechtsboven, tot hoge negatieve waarden; en hetzelfde geldt van B’s cijfer linksonder. De reden: de tegenpartij wordt door de dreiging bang, en met recht. In deze negatieve waarden komt de angst tot uitdrukking. Deze wordt nog versterkt door het, deels reële, deels door propaganda versterkte wantrouwen. De communistische ideologie ziet het kapitalisme per definitie als expansief en oorlogszuchtig; het westen heeft reden tot achterdocht genoeg ten opzichte van door intelligente slagersknechten geleide dictaturen. De angst versterkt aldus de pijlen, die naar het bewapeningshoekpunt wijzen. En van daaruit cumuleert de wedloop op eigen kracht verder, waardoor de negatieve cijfers van het eindresultaat steeds kolossaler worden.
In deze toestand ontbreekt een zadelpunt. De angst speelt in de internationale betrekkingen dus een geheel andere rol dan in de methode, waarmee een bangelijk mens het noodlot tracht te ontgaan. Hij kruipt weg, en neemt met onopvallende resultaten genoegen, opdat potentiële rampen hem over het hoofd zullen zien. Angstige landen daarentegen glijden steeds verder naar het zuidoosten af en lokken daardoor rampen uit. In het laatste vakje staan de cijfers –∾, -∾. Als men een parallel wil trekken met het gedrag van een individu dat met het noodlot wordt geconfronteerd: sommige mensen gaan driftig roken om de angst kwijt te raken, maar worden daardoor tegelijkertijd banger en zenuwachtiger (met reden). Angst en verslaving werken elkaar in de hand, en in plaats van een stabiel zadelpunt treedt er een cumulatief proces op. Bij drinkers gaat het net zo. De wereld is bezig, zich aan de koude oorlog te bedrinken.
De conclusie hieruit kan ook wel zonder speltheorie, zonder matrices, zadelpunten en pijltjes, worden getrokken, maar zij springt toch des te duidelijker in het oog. De linkerbovenhoek is voor iedereen in letterlijke zin oneindig gunstiger dan de rechterbenedenhoek, en toch komen we, met kernwapens en al, precies daar terecht waar we niet willen. Het lijkt een
ongeloofwaardige paradox. De oorzaak ligt in wezen bij kortzichtigheid: het cumulatieve proces geeft, in de woorden van L.F. Richardson, weer wat de mensen doen ‘if they did not stop to think’. Het benauwende is, dat wij blijkbaar nog onvoldoende ‘denken’. De angst voor de Russische potentaten overheerst, en het is te begrijpen, want het zijn ongure medebewoners; maar wij moeten op één wereld met ze leven. De angst voor de boven onze hoofden gegroeide technologie is even begrijpelijk, maar evenzeer een slechte raadgever. De conclusie is evident en dringend: er moet intensiever gezocht worden naar de diagonaal. Vermindering van de angst; sociatrie; een directe telefoonlijn tussen Kennedy en Chroestjow; in ieder geval: polemologie. Het blijkt duidelijk, dat deze laatste wetenschap bovenaan de urgentielijst der intellectuele bezigheden behoort te staan.
- 1)
- Ik noem: R.D. Luce & H. Raiffa, Games and Decisions (N. York 1957); T.C. Schelling, The Strategy of Conflict (Cambridge 1960); A. Rapoport, Fights, Games and Debates (Ann Arbor 1960); K.E. Boulding, Conflict and Defense, N. York 1962). Er zijn tientallen andere werken, die de liefhebber wel kent en die door de anderen toch niet zullen worden gelezen. De vier genoemde boeken zijn in ieder geval heel stimulerend; het curieuze boek van Rapoport (wiskundige, bioloog en bespiegelaar over oorlog en vrede tussen mensen, dieren en volkeren) kan ik iedereen aanraden, die met enige volhardendheid en nieuwsgierigheid is begif tigd.
- 2)
- Sommigen spreken thans van maximin. De oude uitdrukking minimax klinkt mij welluidender en vertrouwder in de oren; de associatie met een duits brandblusapparaat doet daaraan geen afbreuk. Integendeel. De reclamezin: ?Feuer breitet sich nicht aus, hast du Minimax in Haus? slaat op ongezochte wijze op onze matrix.
- 3)
- Deze termen zijn onvermijdelijk. Ik beoog er geen reclame mee te maken voor mijn laatste boek, dat ?Harmonie en Conflict? heet. Daarin staat trouwens niets over speltheorie. Ten onrechte, vinden sommigen.
- 4)
- Bijvoorbeeld: K.E. Boulding, op. cit. blz. 51, aan wie de voorbeelden zijn ontleend.
- 5)
- Rapoport past de speltheorie toe op een aantal bijzondere gevallen, zoals dat van de twee gevangenen die elkaar kunnen aangeven om er zo beter af te komen, en op Othello die zich over de betwijfelde huwelijkstrouw van Desdemona zit op te winden. De diverse mogelijkheden worden door de matrices op aardige wijze gesystematiseerd. Ook de vorming van coalities bij ?n-persoons spelen met variabele som? kan zo worden doorgelicht.