Google kiest Trifacta als partner voor Google Cloud Dataprep

13-03-2017 | door: Hans Steeman

Google kiest Trifacta als partner voor Google Cloud Dataprep

Big Data is big business, maar het analyseren van big data is nog steeds een serieus probleem. Het vinden van de juiste informatie in de data meren is een gespecialiseerde klus waarvoor steeds slimmere software ontwikkeld moet worden. Juist daar heeft het in San Francisco gevestigde Trifacta de afgelopen jaren een sterke positie in verworven. De industrie ziet het bedrijf als marktleider. Deze positie is nu ook op internationaal niveau erkend, nu Google de software, zoals aangekondigd tijdens de Google Next conferentie, van Trifacta gaat gebruiken in zijn Google Cloud Dataprep producten.

Bertrand Cariou (foto), Senior Director of Solutions and Partner Marketing: “Onze oplossing is uniek en helpt veel multinationals bij het vinden van nieuwe inkomstenbronnen. Maar ook tijdens de recente verkiezingen in de Verenigde Staten en het Brexit referendum, was de software essentieel toen de in Los Angeles gevestigde start-up Nationbuilder de kandidaten van gespecialiseerde informatie over het kiezerspotentieel voorzag.”

Trifacta werd in 2012 opgericht door wetenschappers en professoren van verschillende universiteiten en is nu al zeer succesvol met een breed scala aan klanten in 135 landen, waaronder BP, LinkedIn, Pepsi, Nationbuilder, Etihad, Royal Bank of Scotland. Kern van de Trifacta-competentie is data wrangling, het zoeken naar een rode draad in big databestanden door overbodige data te verwijderen en rode draden te vinden en te structureren.

Wranglen

Databestanden kunnen pas gebruikt worden als ze op elkaar afgestemd zijn; het zogenaamde wranglen. Nadat de chaos plaats gemaakt heeft voor structuur, kan er aan de echte analyse begonnen worden. Als handmatig zo’n proces opgepakt wordt, bijvoorbeeld via spreadsheets, vervalt de gebruiker in een schier onmogelijke klus. Automatisering is de enige optie. Trifacta doe dit door te beginnen met een beperkt sample van het bestand en dit gaandeweg te analyseren. Om snelheid te winnen wordt een random sample genomen en dit tijdens het proces verfijnd met andere samples die aanvullende informatie geven. Hiermee wordt voorkomen dat relevante samples van unieke en weinig voorkomende combinaties verloren gaan, aldus Cariou.

Van de Trifacta software worden meerdere smaken aangebonden, waaronder een gratis versie die lokaal bestanden tot 100 Mbyte kan analyseren. "Zakelijke gebruikers kunnen na het kopen van een licentie (Trifacta Wrangle enterprise) grotere bestanden aan en zelfs gebruik maken van een via de cloud beschikbaar gestelde versie Trifacta Wrangle Edge", zo besluit Cariou.

Door: Hans Steeman

Terug naar nieuws overzicht