Redactie - 20 juli 2016

De waarde van content

Vorige keer heb ik verhaald over hoe documentmanagement en business intelligence samenkomen in nieuwe Enterprise Information Management systemen (IEM) en hoe archivering, oude applicaties opruimen en moderne big data-omgevingen bouwen, heel interessant samengaan. Een soort recycling van de bestaande infrastructuur met herbruikbare data en veel (licentie-) kostenbesparingen. Twee gecombineerde processen waar de besparing zelfs vaak groter is dan de investering om die nieuwe omgevingen te bouwen. Wie wil dat niet?! Mede omdat het hierdoor mogelijk wordt om afscheid te nemen van oude licentieverplichtingen en nieuwe Open Source-mogelijkheden te omarmen. En een gezonde readyness voor de toekomst op te bouwen.

Standaardisatie

In het verleden veranderden standaarden rond data en de bewerking van data regelmatig. Een logische ontwikkeling in de snel ontwikkelende informatiewereld van eind vorige en begin van deze eeuw. We wisten steeds beter wat we echt wilden en bouwden regelmatig nieuwe (betere) architecturen, creëerden nieuwe standaarden, betere protocollen en compliance en wetgeving. Kortom we hebben een ‘mèr a boire’ van oude data-omgevingen die nog steeds van waarde zijn maar eigenlijk uitgefaseerd moeten worden, mede omdat zowel specialisten verdwijnen en dat de software en hardware niet meer worden ondersteund.

Goede raad is duur, maar gelukkig heeft internet, de cloud en open source ons hele mooie standaarden gegeven die – voor zover te overzien – voor lange tijd houdbaar zullen blijven. Eén van die standaarden is XML, de Extensible Markup Language om data in open en dus overal toegankelijk formaat te definiëren. XML is midden jaren negentig opgekomen als middenweg tussen de lichtvoetige HTML-standaard die we voor het internet gebruikten en SGML, een oudere, zware maar zuivere markup taal die IBM in de jaren tachtig had ontwikkeld om documenten gestructureerd op te slaan.

XML als wereldwijde standaard

XML is een standaard van het World Wide Web consortium voor de syntax van formele opmaaktalen, waarmee men gestructureerde gegevens kan weergeven in de vorm van platte tekst. Voordeel is dat deze presentatie zowel machine leesbaar, als leesbaar voor de mens is. Het XML-formaat is tegenwoordig de standaard om gegevens op te slaan en om gegevens over het internet te versturen.

Midden jaren negentig – toen deze taal opkwam – ontstonden vele initiatieven om deze nieuwe standaard te gebruiken. De NATO startte toen het CALS-PLCS project om XML de standaard voor Computer Aided Logistics and Acquisition Support te maken. Een project waarin ik ook nog actief heb geparticipeerd en kort gezegd een standaard is voor het gebruik en onderhoud van militaire producten gebaseerd op een Product Life Cycle Management standaard.

XML databases

Omdat steeds meer informatie in XML werd beschreven, ontstond de behoefte aan XML-databases en een Nederlandse startup X-Hive was hier heel succesvol mee, mede omdat zij al snel grote bedrijven als Boeing als klant kregen. In 2007 acquireerde EMC het bedrijf en bracht het onder in de content management divisie Documentum. Hierdoor konden we onder de content management-laag een robuust XML-gebaseerde repository bouwen voor metadata-management.

Het mooie van XML-databases is dat het een prima platform is om zeer granulair datamigraties van zeer grote aantallen datasets uit te voeren. Van de ene database naar de andere, maar natuurlijk ook als het de laatste stap van archivering betreft. En dus vele soorten datasets naar XML kan vertalen en uiteindelijk in het standaardformaat XML te archiveren.

InfoArchive

De oplossing InfoArchive is enkele jaren geleden ontstaan uit een initiatief van een Franse bank die een groot volume archiefomgeving wilde bouwen voor zijn oude transactionele documenten zoals rekeningen, statements en gestructureerde data van banking applicaties. Het archief moest voldoen aan de standaarden van SEPA (Single European Payment Authority) en moest tientallen miljarden objecten gestructureerd kunnen opslaan.

Dit vroeg om een totaal nieuwe aanpak en architectuur en het bleek dat de migratie capabiliteiten van xDB, de XML gebaseerde database van X-Hive hiervoor de essentiële technologie bezat. De InfoArchive-oplossing combineert op zeer slimme wijze de sterkte van Content Management voor gestructureerde content en het granulair en schaalbaar kunnen archiveren op basis van open standaarden. En dus ook oude 2e platform omgevingen te kunnen migreren en archiveren naar nieuwe cloud en big data gestandaardiseerde omgevingen.

Opruimen

Eerder heb ik, in een parodie op de reclame ‘Bart, ruim je speelgoed nu eens op’ een blog geschreven onder de titel ‘Ruim je data nu eens op’. Naast dat we veel te veel (onzinnige) data jarenlang bewaren, kunnen we oude IT-infrastructuren ook niet al te best renoveren. Terwijl daar heel veel besparingsgeld ligt te wachten dat we nuttig kunnen gebruiken voor nieuwe investeringen. Serieus Enterprise Informatie Management zorgt enerzijds dat data die (uiteindelijk) niet meer belangrijk is ook weggegooid mag en kan worden. Van alle projectdata hoeft vaak niet meer dan tien procent werkelijk bewaard te worden.

Daarnaast kan oude data eenvoudig worden gemigreerd naar open standaarden zoals XML, waar het goedkoop zeer lang beschikbaar kan blijven voor audits, compliance of big data-toepassingen. Het kunnen afschakelen van oude applicaties, databases, storage en onderliggende servers wordt op die wijze een ‘No Brainer’ mede om van oude licenties af te komen. Het goud ligt in die oude IT-wereld werkelijk voor het oprapen.

Archiveren is een steeds breder vak.

In een publicatie ‘Een terugblik uit 2023 . . . hoe het allemaal begon’ heb ik al eerder beschreven dat de werkelijke eindgebruiker van data de archivaris is. En die archivaris kan enerzijds professioneel archiveren – bewaren wat bewaard moet blijven maar zeker ook weggooien wat weg mag – en anderzijds als bevoegde beambte de groeiende eisen op het gebied van compliance, governance en het risicomanagement uitvoeren.

Maar daarnaast kan hij of zij – in samenwerking met IT – ook oude omgevingen helpen opruimen, migreren of opnieuw helpen bouwen.

Veel organisaties hebben intussen een Chief Data Officer (CDO) die (ook) de verantwoording heeft voor dataonderhoud en recycling. Het wordt steeds lastiger alle content die we gebruiken op te slaan, laat staan langdurig en compliant te bewaren. Hoe eerder we weggooien wat overbodig is en/of geen waarde heeft, des te beter zijn we bestand tegen de groeiende content-tsunami die over ons heen komt. En het bespaart ook nog eens onwijs veel geld aan overbodige opslag…

Door: Hans Timmerman, CTO EMC Nederland

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!