Witold Kepinski - 06 mei 2019

Alation structureert data tot bibliotheken

Data is overal aanwezig en het aanbod blijft groeien. Apparaten en mensen, allemaal zijn ze een bron van gegevens die geanalyseerd en gearchiveerd kunnen worden. Zelfs de huidige moderne auto’s hebben al snel 200 sensoren aan boord en leveren veel informatie op over de staat van het voertuig. Een ander markant voorbeeld: General Electric ontvangt tot zo’n 5000 samples per seconde per vliegtuigmotor in gebruik. Het stuwmeer aan data dat dan ontstaat is daarom moeilijk te behappen, tenzij het netjes gecatalogiseerd en gerubriceerd wordt. Verder moeten veel werknemers toegang hebben tot deze data om hun werk goed te doen, en dient gelijktijdig daarbij privacy zoals de GDPR  aangeeft gerespecteerd te worden.

In het Californische Redwood liepen we Satyen Sangani (foto), co-founder and CEO van Alation tegen het lijf. Uiteraard reden genoeg om nog eens in te gaan op het rubriceren van data, een activiteit die hij probeert op te lossen met zijn bedrijf Alation en het product Alation Data Catalog. Satyen Sangani weet het pakkend samen te vatten: “Internet is en verzameling van oneindig veel soorten data en van catalogussen die data klusteren tot hapklare waardevolle brokken. Als data goed gerubriceerd en geclusterd wordt, ontstaat er ruimte voor een nieuwe winstgevende business. Zolang data in losse niet samenwerkende silo’s zit is er weinig mee te beginnen, omdat gebruikers hem niet vinden.”

Clusteren

Web-omgevingen zoals Yelp, Google, LinkedIn, Airbnb zijn allemaal moderne publieke catalogussen die informatie van gelijke aard klusteren en eenvoudig ontsluiten, aldus Sangani. "Deze manier van optimaliseren creëert uiteindelijk een waardevolle dienst. Individueel zou de data van zo’n website weinig waarde genereren, want de klanten vinden hem niet. Grote bedrijven hebben met hun big data een vergelijkbare uitdaging. Vaak zijn er teams die onafhankelijk en onwetend van elkaar hetzelfde probleem aanpakken met data in gescheiden silo’s (zoals Salesforce en ERP). Met een tool als deze wordt dat inzichtelijk en de informatie van die silo’s geclusterd tot één geheel. Het is dan ook logisch dat dit type bedrijven de technologie van Alation gaan gebruiken."

Metadata

Alation Data Catalog creëert een databibliotheek waarmee iedereen binnen de organisatie de data kan vinden die hij zoekt om samen te werken. "De software indexeert daartoe geheel automatisch de data bij de bron (silo) en genereert er metadata omheen. In navolging van bijvoorbeeld zoekmachine Google, gebruik Alation kunstmatige intelligentie (AI) om steeds dichter op de wensen van de gebruikers te indexeren. Daarmee wordt alle bedrijfsdata uniform en veredeld beschikbaar gemaakt voor alle medewerkers. De resultaten kunnen bij iedere nieuwe zoekactie hergebruikt worden. De catalogus wordt daarmee steeds verder geoptimaliseerd. Alation Data Catalog is volledig op cloud technologie gebaseerd en in elk type bedrijf inzetbaar. Er is een 30 dagen testversie beschikbaar" aldus Satyen Sangani.

Door: Hans Steeman

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!