We slaan meer data op dan ooit. Foto’s, video’s, logbestanden, sensordata, AI-modellen, klantprofielen, rapportages, back-ups van back-ups. Opslag is goedkoop geworden, zo lijkt het, en vrijwel onbeperkt beschikbaar. De vraag of we iets bewaren is in veel organisaties al lang geen vraag meer. De echte vraag is wanneer we zijn vergeten waarom we het eigenlijk doen.
Het lijkt onschuldig, want data wordt vaak gezien als grondstof voor innovatie, efficiëntie en inzicht. Maar datagroei begint steeds meer te wringen. Niet alleen financieel, maar ook organisatorisch, juridisch en maatschappelijk. Nederland digitaliseert razendsnel, maar de bijbehorende datahonger groeit nog harder.
Tot een jaar of tien geleden was opslag schaars. Schijven waren duur, capaciteit was beperkt en elke extra gigabyte moest worden afgewogen. Die tijd ligt ver achter ons. Cloudopslag is per definitie schaalbaar en lijkt oneindig. ‘Vol’ bestaat niet meer, alleen maandelijkste kosten.
Dat betekent nogal wat voor de dagelijkse praktijk. In plaats van selecteren en opruimen is het devies vaak geworden: alles bewaren, voor het geval dat. Niet omdat iemand exact weet waarvoor die data nodig is, maar omdat weggooien ingewikkeld voelt. Juridisch risicovol, organisatorisch spannend en praktisch onhandig.
Het leidt tot vreemde situaties. Organisaties die tientallen petabytes opslaan zonder enig idee van de inhoud. Afdelingen die hun eigen databergen aanleggen buiten het zicht van IT. Back-ups die jarenlang blijven bestaan zonder actief gebruik.
Data als bijproduct
De groei van data is geen op zichzelf staand fenomeen. Elke stap in digitalisering produceert nieuwe informatie. Online werken, slimme apparaten, cameratoezicht, sensoren, apps en AI-systemen: elk proces laat een datakruimelspoor achter. Vaak zonder dat expliciet wordt besloten wat we daar later mee willen.
Daarmee verschuift data van doel naar bijproduct. We verzamelen het niet, het ontstaat gewoon. Wie een videovergadering start, genereert metadata. Wie een webshop runt, bouwt automatisch klantprofielen. Wie machines monitort, slaat elke seconde meetwaarden op. En dat meestal zonder expliciet bewaarbeleid.
De paradox is dat veel organisaties tegelijk klagen over een gebrek aan inzicht, terwijl ze verdrinken in informatie. Meer data leidt niet vanzelf tot betere beslissingen. Vaak juist het tegenovergestelde. Hoe groter de berg, hoe lastiger het wordt om gerichte vragen te stellen.
De kosten die niemand echt ziet
Opslag lijkt goedkoop. Een paar euro per terabyte per maand is geen drempel die bestuurlijke discussies oproept. Maar die lage instap misleidt. Want data kost niet alleen ruimte, maar ook beheer, beveiliging, back-up, compliance, energie en netwerkcapaciteit. Die kosten worden zelden in zichtbaar in een overzicht van de kosten van opslag. Ze zitten verspreid over budgetten, leveranciers en contracten.
Daar komt nog bij dat data zelden verdwijnt. Wat eenmaal is opgeslagen, blijft vaak bestaan. Systemen worden vervangen, maar archieven migreren mee. Projecten stoppen, maar datasets leven door. Dit voelt voor veel organisaties ongemakkelijk. Want opruimen betekent keuzes maken. Wat mag weg, wat moet blijven, wie beslist daarover en wie draagt het risico als er iets verdwijnt dat later toch nodig blijkt? Het is veiliger om het dus gewoon uit te stellen, en zo de berg nog verder te vergroten.
Juridische mist
Datahonger wordt ook gevoed door onzekerheid over wetgeving. Privacyregels, bewaarplichten, archiefwetten, audits. Veel organisaties kiezen ook hier voor de veilige kant door alles te bewaren. Niet omdat de wet dat expliciet vraagt, maar omdat niemand het tegendeel durft te onderbouwen.
En dat terwijl bewaarplicht en privacy steeds vaker botsen. Wat mag je bewaren en hoe lang? Wanneer wordt informatieve waarde een juridisch risico? En wie is verantwoordelijk als data jarenlang blijft bestaan zonder duidelijk doel? Dat zijn vragen die niet alleen bij juristen thuishoren, maar steeds vaker op bestuursniveau belanden.
Data staat daarnaast zelden op één plek. Verspreid over cloudplatforms, SaaS-diensten, back-ups, legacy-omgevingen en lokale systemen ontstaat een lappendeken waar niemand nog volledig grip op heeft. Dat maakt het beheersen van risico’s complex, ook zonder dat er sprake is van incidenten.
De mythe van later
Een veelgehoorde reden om alles te bewaren is het idee dat data in de toekomst waarde kan krijgen. Voor analyses, optimalisatie, AI-toepassingen of beleidsvorming. Dat klopt. Soms. Het veronderstelt ook dat data daadwerkelijk bruikbaar blijft. En dat blijkt maar zelden het geval.
Datasets verouderen. Structuren veranderen. Context verdwijnt. Zonder actieve datakwaliteit verliest informatie snel zijn betekenis. Oude data wordt daardoor zelden een goudmijn, maar eerder een digitaal moeras waarin niemand nog de weg vindt. Toekomstwaarde ontstaat niet vanzelf. Die vraagt om actief beheer, heldere doelen en periodieke keuzes.
Menselijk gedrag
De kern van de datahonger ligt niet in techniek, maar in menselijk gedrag. In de neiging om te verzamelen in plaats van te selecteren. In de angst om te verwijderen. In de veronderstelling dat meer altijd beter is. Zolang die reflex intact blijft, blijft de berg groeien.
Daarom verschuift de discussie langzaam van opslagcapaciteit naar datagebruik. Niet hoeveel je kunt bewaren, maar wat je wilt bewaren en waarom. Dat vraagt om andere gesprekspartners. Niet alleen IT en beheer, maar ook bestuur, juridische afdelingen, privacy-officers, controllers en duurzaamheidsteams. Data is dus gewoon een vraagstuk van de héle organisatie.


