Marktplaats en statistiek
Geanticipeerd gebruik van deze dataset was (1) het schatten van de omzet in tweedehands goederen,(2) het verrijken van de gegevens met data van het CBS zodat nieuwe statistische informatie zou ontstaan en (3) het onderzoeken van een mogelijke samenhang met conjunctuurindicatoren. Daarnaast was het ook een proces van trial-and-error om te ontdekken wat het CBS met de data zou kunnen bij het maken van ‘officiële’ statistieken. Dit project was onderdeel van het programma Impact ICT en dan vooral het deel dat ingaat op de mogelijkheden om te komen tot een betere beschrijving van de interneteconomie.
Een eerste reflex was de enorme dataset te structureren en ‘gaaf te maken’, dat wil zeggen gegevens die niet plausibel leken, te verwijderen. Uiteindelijk is dit maar op zeer bescheiden schaal gedaan en is besloten de data vooral voor zichzelf te laten spreken. In hoofdstuk 2 zijn de van Marktplaats ontvangen data gepresenteerd. Dit roept een beeld op van een hele grote, hele heterogene en heel scheef verdeelde dataset waar maar moeilijk patronen in te ontdekken zijn. Statistische kengetallen zoals een gemiddelde waarde van een variabele zijn slechts zeer ten dele in staat een dergelijke dataset tot leven te brengen. In hoofdstuk 3 zijn de Marktplaatsdata op postcodeniveau gekoppeld aan data van het CBS. Dit leidt tot nieuwe statistische informatie over de regionale spreiding van het gebruik van Marktplaats en, op basis van de karakteristieken van de postcodegebieden, tot inzicht in de karakteristieken van de ‘Marktplaatsgebruiker’. Een schatting van de omzet in tweedehands goederen is niet gemaakt. Er ontbraken te veel cruciale gegevens zodat dit met te veel arbitraire aannames gepaard zou moeten gaan. De Marktplaatsdata bleken wel een samenhang met de conjunctuur te vertonen. Zowel met de algemene conjunctuurcyclus als met het consumentenvertrouwen en de detailhandelsomzet. Hierbij hing het aanbod op Marktplaats (advertenties) positief samen met de conjunctuur en de vraag (biedingen) negatief.