Ongestructureerde data kost organisaties onnodig veel geld en vergroot risico’s

19-09-2019 | door: Blogger

Ongestructureerde data kost organisaties onnodig veel geld en vergroot risico’s

Organisaties hebben de afgelopen jaren te maken gekregen met een omvangrijke groei van hun data. Hierbij gaat het om nieuwe databronnen/applicaties, meer en grotere bestanden, die door diverse redenen ook nog eens meervoudig dubbel op het netwerk worden opgeslagen. Dubbele data vormt één van de componenten van ROT-data. ROT-data (ROT staat voor Redundant, Obsolete en Trivial): kortom dubbele data (verspreid over meerdere databronnen), verouderde data en data die niet op het netwerk zou moeten staan. ROT-data, vaak data zonder eigenaar, vormt dan ook een groot component van de totale dataset. ROT-data bedraagt in de praktijk tussen de 40% en 70% van de totale dataset. Een doorn in het oog voor veel (IT) organisaties.

De dataexplosie: een uitdaging voor iedere organisatie
Direct gevolg van de zogeheten dataexplosie is dat organisaties steeds meer opslagcapaciteit nodig hebben, zowel primaire opslag (productie storage) als in secundaire opslag voor back-up (containerbegrip voor secundaire storage, uitwijk, DR en archivering). Dit levert vaak onnodige kosten op. Slimme data-reductietechnieken zoals deduplicatie en compressie maskeren de feitelijke pijn. Zoals gezegd vormt dus met name de wildgroei van ongestructureerde data een serieus probleem. Als organisatie wil je dit inperken in verband met kosten en risico’s vanuit compliancy oogpunt. Ter verduidelijking, ongestructureerde data komt voort uit databronnen zoals fileshares, Exchange en Sharepoint. Denk aan (Word) documenten, Excel sheets, .pdf files, foto’s en ga zo maar door.

Inzicht en blijvende controle
Belangrijke vragen die iedere organisatie zichzelf zou moeten stellen is: hoe gaan we nu blijvend inzicht krijgen en controle houden op deze snel groeiende dataset? En, hoe gaan we ervoor zorgen dat we door middel van de verkregen inzichten weloverwogen keuzes kunnen omzetten in geautomatiseerde policy’s? Buiten wet- en regelgeving zijn er vele redenen waarom je volledig en permanent inzicht, overzicht en blijvende controle op jouw ongestructureerde data zou moeten hebben. Een treffend voorbeeld: in de praktijk wordt ongestructureerde data op allerlei (on)geoorloofde plaatsen op het netwerk opgeslagen. Resultaat is dat mogelijk gevoelige (persoonsgegevens) of zelfs vertrouwelijke informatie (intellectueel eigendom) op de verkeerde plaatsen belandt. Deze data is dan inzichtelijk geworden voor medewerkers die deze toegang juist niet behoren te hebben, met alle mogelijke gevolgen van dien.

Wat zijn voor organisaties redenen om in actie te komen?

Controle krijgen op de wildgroei aan data

Hoe is onze dataset opgebouwd (leeftijd, type data, grootgebruikers)?

Dataminimalisatie/datareductie bewerkstelligen

Wil jouw organisatie de dataset optimaliseren door het signaleren en elimineren van ROT-data, bijvoorbeeld voorafgaand aan een migratie richting de cloud?

Vindbaarheid van informatie

Waar staan persoonsgegevens (PII-data) en/of intellectueel eigendom?

Databeveiliging en archivering

Zoek je naar een manier om data, die niet bewaard mag worden, automatisch te verwijderen of beveiligen?

Risicobeheersing: om te kunnen voldoen aan wet- en regelgeving (denk aan de AVG)

Wil je eenvoudig verzoeken kunnen inwilligen van personen om vergeten te worden, AVG artikel 17? Of verzoeken om data mee te mogen nemen, AVG artikel 20? Heeft jouw organisatie beleid geformuleerd op het gebied van data & governance, maar nog niet alle tools om dit succesvol uit te voeren?

De oplossing: intelligente tooling inclusief policy engine
Door middel van intelligente tooling is het mogelijk een antwoord te bieden op bovenstaande thema’s en nog veel meer. Organisaties kunnen daarbij kiezen voor een éénmalige (schonings)actie of (direct) een permanente oplossing. Uiteindelijk wil je, zoveel als mogelijk, geautomatiseerd keuzes maken over wat te doen met ongestructureerde data. Na het verkrijgen van inzichten, kun je de juiste policy’s instellen om doelstellingen te behalen.

Auteur: Arnold Derksen, Sales Manager bij Giant ICT

Terug naar nieuws overzicht