Redactie - 21 november 2022

Ken je de verschillen in data storage toepassingen?

Storage Data

Binnen de dataopslag speelvelden zijn door de hoeveelheid mogelijkheden vaak onduidelijkheden te ontwaren. Meer keuze leidt niet ogenblikkelijk tot betere en efficiëntere variaties. Soms gaat het al mis bij de term primair. Binnen IT betekend primaire opslag, zoveel als eerste lijns of hot data, data die jong is of veelvuldig gebruikt wordt terwijl secondaire data, je raad het al data is die ouder is, minder geraadpleegd of ongestructureerd van vorm is, ook wel ruwe data genoemd.

Binnen de onderzoekswereld geldt er voor dezelfde “Primaire data ”een andere uitleg; Primaire data zijn data, oftewel primaire gegevens, beter omschreven als ruwe data die een onderzoeker zelf vergaart voor een onderzoek middels bijvoorbeeld een interview, enquête of observatie.

Je zult begrijpen dat deze variatie in terminologie niet bijdraagt aan het goed begrijpen van business(onderzoek) en IT.

Primaire Back-ups.

Waarom maken we eigenlijk back-ups? Een back-up of reservekopie is een kopie van gegevens die zich op een gegevensdrager of een applicatie bevinden om deze te kunnen herstellen mochten ze beschadigd raken.

Door het maken van back-ups willen we eventueel dataverlies beperken tot een vooraf gedefinieerd en aanvaardbaar niveau. Dit niveau wordt ook wel het RPO (Recovery Point Objective) genoemd en geeft aan hoeveel dataverlies er maximaal geoorloofd is, aangegeven in een tijdsduur. Dus als je maximaal 4 uur werk permitteert kwijt te zijn, moet je om de 4 uur een veilige back-up maken van je gegevens.

Kort samengevat bepaalt de RPO in welke opslagstructuur er back-ups gemaakt moeten worden. Om een goede en veilige back-up te maken adviseert men deze op te slaan in een aantal verschillende media en locaties. Deze media kunnen flash, disk, tape en/Cloud elementen bevatten. Daarnaast spreken we ook nog over RTO. Met RTO druk je uit hoelang het maximaal mag duren voordat je up-and-running wil zijn na een probleem of disaster.

Dan de secondaire dataopslag in een notendop.

De naam zegt het al het gaat hier om tweedelijns data, data die uit ouderdomsoverwegingen niet langer in een primaire omgeving gehouden dient te worden, omdat deze nooit meer geraadpleegd wordt en wel bewaart dient te worden, of dat die bestaat uit niet primaire elementen zoals ruwe onderzoekdata, rekenformules zaken die het opnieuw uitvinden van het wiel overbodig maken.

Met name de secondaire dataomgevingen groeien in verhouding het snelst. Dit wordt veroorzaakt doordat de versnelde digitalisering van onze maatschappij en het overgrote deel van deze data ongestructureerd van karakter is en mede door machines(M2M, telefoons, communicatiemiddelen) veroorzaakt wordt. Onze gezondheidszorg die met meerdere datagroei factoren te maken heeft, doordat de zorg efficiënter maar ook steeds complexer wordt, ziet men haar deel ongestructureerde data groeien, data die bestaat uit scans, medische foto`s en grote hoeveelheden tekstuele behandelplannen die vaak ook nog eens tussen behandelaars gedeeld en aangevuld worden. Ook in de film/broadcast industrie ziet men eenzelfde groei. Dataformaten in de vorm van filmbeelden zijn tot factor 8 verbeterd(8K) wat automatisch betekend dat ook de hoeveelheid data verachtvoudigt. Kortom een ongebreidelde groei van ongestructureerde data is aan de orde.

Scheiding:

Het is daarom van het grootste belang dat primaire en secondaire data van elkaar gescheiden en bewaard wordt. Met de geboorte van verschillende Cloud technologieën, object storage en data managementsystemen is de efficiëntie, veiligheid en controleerbaarheid enorm toegenomen.

Met name het gebruik van metadata biedt grote mogelijkheden, vindbaarheid, wetenschappelijke inpasbaarheid worden perfectionistisch ten opzichte van traditionele opslagsystemen.

NoSQL biedt inmiddels een breed gamma aan databasemanagementsystemen die enorm verschillen van het klassieke relationele databasemanagementsysteem. De datasystemen bestaan niet altijd uit vaste databaseschema's, en de meest schalen horizontaal i.p.v. verticaal zoals gebruikelijk in SQL-databases.

Wil je meer lezen over ongestructureerde data dan verwijs ik graag naar dit artikel. [urlprefix]707415/alle-data-in-een-platform.html

Door: Harold Koenders, data storage expert

Tip de redactie