Wednesday, July 18, 2012

Over Hans Schnitzler, statistiek en grote voeten

(Note: my apologies for this Dutch entry)


In een opiniestuk in De Volkskrant op 16/07/2012 (zie http://www.volkskrant.nl/vk/nl/3184/opinie/article/detail/3286922/2012/07/16/Wantrouw-statistieken-negeer-peilingen.dhtml) houdt de filosoof Hans Schnitzler ons voor dat we de statisticus moeten wantrouwen en de opiniepeiler negeren. Het is zijn goed recht om dat te doen. Er zijn, vooral in Nederland, de laatste tijd nogal wat persberichten verschenen rond opiniepeilingen die inderdaad de wenkbrauwen doen fronsen.

Als Schnitzler ijvert voor grotere steekproeven en meer zorg voor representativiteit dan zal hij bij heel wat statistici en opiniepeilers op bijval kunnen rekenen. Meer zelfs, uitgerekend uit de hoek van opiniepeilers, en marktonderzoekers in het algemeen, is er een vraag om met meer zorg en nuance over onderzoek te rapporteren in de populaire pers. Als er al sprake is van een illusie van voorspelbaarheid dan wordt die illusie meer gevoed door de verslaggeving rond bepaalde onderzoeken dan door de onderzoekers zelf. Het zijn juist de onderzoekers die er vaak op aandringen dat de beperkingen van hun onderzoek worden opgenomen in de verslaggeving. Helaas lukt dat niet altijd.

Maar los daarvan, wat me zwaar tegenvalt in het stuk is dat de argumenten die de filosoof Schnitzler aanhaalt om z’n stelling te onderbouwen helaas zwak en vaak zelfs helemaal fout zijn.

Ten eerste is er de misvatting dat in statistiek alles draait om het gemiddelde. Dat is geenszins zo. Als er al één parameter is waaraan meer belang wordt gehecht dan een ander dan zal het eerder de spreiding zijn. Een veel gehoorde quote bij statistici gaat daar trouwens over:”Very little in life is precise. It’s all about variance”. Overigens vind je in de begindagen van de statistiek eerder een fascinatie voor wat minder frequent voorkomt, bv. in kansspelen allerhande. Er is trouwens een hele tak van de statistiek die gewijd is aan de theorie over extreme waarden. Toepassingen van deze theorie vind je bij rampen en calamiteiten.

Een tweede misvatting heeft te maken met de zogenaamde normaalverdeling. Ja, daar komt het woord “normaal” in voor, maar dat mag je helemaal niet normerend beschouwen. Het woord normaal slaat op het feit dat deze verdeling zo alom tegenwoordig is in de statistiek. Dat hoeft zelfs niets te maken hebben met het gemiddelde als dusdanig. Als je bijvoorbeeld honderden steekproeven zou nemen van een man of vijftig, en je zou telkens de grootste schoenmaat opmeten, om bij een voorbeeld van Schnitzler te blijven, dan zou je, onder bepaalde voorwaarden, ook dicht bij een normaalverdeling kunnen uitkomen. Toegegeven, als statistici gewoon de naam “Gaussiaanse verdeling” hadden gehanteerd in plaats van de normaalverdeling, dan had deze misvatting allicht vermeden kunnen worden.

Ten derde wil het gebruik van statistieken helemaal niet zeggen dat men geen oog zou hebben voor uitzonderlijke of excentrieke gebeurtenissen die de loop van de geschiedenis hebben bepaald. Het is vaak andersom. Vaak worden statistische technieken gebruikt om aan te tonen hoe klein de kans op een bepaalde, al dan niet invloedrijke, gebeurtenis geweest is.

Tenslotte zou ik wil wijzen op een aantal andere kleinere onjuistheden. Ten eerste toont politiek wetenschappelijk onderzoek juist aan dat mensen niet om de haverklap van mening veranderen over heel wat onderwerpen, met name wat betreft politieke voorkeur. Historisch gesproken is er misschien wel een stijging waar te nemen van de mate waarin men rond bepaalde onderwerpen van mening verandert, maar dat wil nog niet om de haverklap zeggen. Ten tweede is het inderdaad zo dat een deel van het electoraat z’n keuze pas in het stemhokje maakt, maar dat blijft een minderheid.

Het is goed dat een opiniemaker de mensen probeert wakker te schudden rond een bepaald thema. Maar van een filosoof verwacht ik toch net iets meer moeite om gefundeerd uit de hoek te komen dan een opsomming van een aantal gemeenplaatsen en onjuistheden. Ik laat ik het aan de lezer over om al dan niet statistieken te wantrouwen. Persoonlijk wantrouw ik heel wat statistieken, vooral deze die in de populaire pers verschijnen.