Redactie - 03 mei 2018

Big Data in de Cloud, staat je data dan altijd buiten de deur?

Big Data in de Cloud, staat je data dan altijd buiten de deur? image

Dat zou je inderdaad kunnen denken maar niets is minder waar. De gemiddelde gebruiker die denkt aan Cloud opslag zal natuurlijk de publieke Cloud aanbieders op zijn blikveld krijgen maar wist je dat juist de publieke Cloud aanbieders de weg naar andere vormen van Cloudopslag geopend hebben.

Wellicht wat uitleg. De meest voorkomende Cloudinfrastructuur is gebaseerd op een door Amazon ontwikkeld protocol. S3, de Simple Storage Service. Deze online object store is inmiddels meer dan twaalf jaar oud en wordt gebruikt voor de opslag van miljarden objecten en deze omvang groeit met de dag. Ook de andere public Cloud aanbieders gebruiken een vergelijkbaar protocol.

Veel data verzamelaars die af wilden zijn van het onderhouden van “eigen” IT-infrastructuur namen massaal een vlucht naar de publieke Cloud echter gold dat niet voor organisaties die iets meer waarde hechten aan data veiligheid of door wetgeving geen data in openbare voorzieningen mochten opslaan. Ook nu met de komst van de GDPR onze wetgeving veranderd en verschillende openbare Cloud aanbieders enige vorm van “lekkage” vertoonden werd er massaal een terugtrekkende beweging gemaakt. Een van de meest voorkomende redenen voor de terugtrekkende bewegingen is wel het kosten aspect. Data brengen is relatief goedkoop. Data van en naar de public Cloud sturen omdat deze data met regelmaat gebruikt wordt voor analyses is heel kostbaar zou is gebleken.

De groei van data, Data is het nieuwe goud

De kracht van de Cloud bevindt zich met name binnen de capaciteit waarop het platform enorme ongestructureerde data hoeveelheden efficiënt en schaalbaar kan opslaan. Met de groei van Big Data neemt het belang van data-analyse toe. Hoe meer gegevens beschikbaar zijn, des te beter organisaties in staat zijn om data-onderwerpen te vergelijken en relaties hierin aan te leggen. Met als voorwaarde dat de analysing tools de enorme hoeveelheid vaak ongestructureerde data weten te interpreteren. Daarvoor verschijnen steeds meer analysing tools met een range aan algoritmes en structuren om karakteristieken van data bij te staan. Op deze wijze kunnen inzichten uit enorme datasets ook werkelijk gebruikt worden voor het verbeteren van de efficiëntie en organisatorische processen.

Hybride Cloud en Private Cloud het gebruik van S3 tooling

De S3 API is een application programming interface die het mogelijk maakt om objecten oftewel binaire databestanden in S3 op te slaan, te halen, in kaart te brengen en te verwijderen op basis van simpele opdrachten zoals put- en get-instructies.

Hierdoor kunnen veel op basis van S3 API werkende Big data tooling als een “app” aan uw eigen Cloud omgeving “gehangen” worden. Ik zeg app omdat het gebruik enigszins lijkt op het gebruik van de Apple app store. Je hebt de machinerie en infrastructuur maar haalt slimme tools als app naar binnen zodat uiteraard afhankelijk van de functionaliteit hun werk kunnen doen. Zo zijn er diverse API-tools die in grote bulk dataomgevingen (ongestructureerde data) allerlei verbindingen aan het licht brengen en adviezen aan belanghebbenden kunnen geven.

Vendoren moeten mee

Omdat de S3 API vele jaren een prominente marktpositie weet te behouden en de functionaliteit het volwassenheidsniveau heeft bereikt, is de oplossing uitgegroeid tot de norm voor object-gebaseerde storageprotocollen. Logisch dat iedere zichzelf respecterende Vendor een API-omgeving aan haar omgeving gekoppeld heeft. Leveranciers die melden dat hun oplossing compatibel is met de native S3 API hebben dan ook de voorkeur. Zo kan er bijna nooit sprake zijn van een Vendor insluiting. (lock-in)

Artificial intelligence (AI) en machine learning

Artificial intelligence (AI) en machine learning bieden het bedrijfsleven en de maatschappij oneindig veel mogelijkheden. De kern en inzetbaarheid van dit speelveld wordt bepaald door de mate waarin we data kunnen verzamelen en voor korte of langere tijd kunnen bewaren. De succesfactor van de business wordt de komende tijd bepaald door de wijze waarop organisaties data onder controle weten te houden. Het is dan ook de hoogste tijd om alle mogelijke potentiële strategische scenario’s in kaart te brengen.

Artsen die behandel adviezen ontvangen van IBM Watson, retailers die klantbewegingen en koopgedrag voorspelt krijgen uit massa-data of maak industrieën die productie en calculatie risico`s voorkomen op basis van data-analyse voortkomende uit enorme ongestructureerde data hoeveelheden laten zien dat er veel mogelijk binnen artificieel intelligence omgevingen.

Door het gebruik van een Cloud-archive ben je in staat om ook oudere(koele en koude) archief data on-line en snel beschikbaar te houden? De mogelijkheid bestaat om Meta data te verrijken zodat onderwerpen beter vindbaar zijn. Behalve dat je kennis maakt met “machine learning” en “artificial intelligence” die mogelijkheden bieden die hiervoor onmogelijk leken, ontlast je ook nog eens je productie omgeving hetgeen je TCO zeer ten goede komt.

Meet voorkomende gebruikers van Private Cloudgebruikers zijn Broadcast & media, CCTV, Healthcare and life-sciences, Financial institutes, Retail and IoT driven industrieën.

Artificial intelligence (AI) en machine learning vragen derhalve om een nieuwe IT Strategie!

Door: Harold Koenders, Pronovus

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!