De revolutie van het Open Data for Data Science ecosysteem
Innovatie en universitair onderwijs gaan hand in hand. Zonder de juiste omgeving om theoretische modellen door te rekenen, te analyseren en te toetsen kunnen onderzoeksrapporten immers niet afgerond worden. Daarom is de Rijksuniversiteit Groningen drie jaar geleden gaan samenwerken met Dell Technologies aan het Open Data for Data Science (ODDS) ecosysteem. Een jaar geleden is daar ook Infinity IT bij gekomen. Dit ecosysteem is gebaseerd op software, Web3 technieken en maakt gebruik van blockchain om snel data uit te wisselen, op een veilige wijze. Waarbij de eigendom van de data bij de eigenaar blijft. Een revolutionair model welke volop in ontwikkeling is. Onder andere de visserij in Nederland maakt gebruik van dit ecosysteem in productie en heeft daarmee ook het nieuws gehaald. Ook de financiële sector en de zorg zouden enorm voordeel hiermee kunnen behalen. Niet gek dat internationaal interesse wordt getoond in het ODDS ecosysteem.
Henk-Jan Zilverberg is met zijn team verantwoordelijk voor de centrale rekenclusters van de Rijksuniversiteit Groningen. “Voor ons als universiteit is innovatie belangrijk. Zonder nieuwe technieken te onderzoeken kunnen we onze onderzoekers in de toekomst niet meer faciliteren voor hun hoogwaardig onderzoek. Om het onderwijs en de nodige onderzoeksvraagstukken beter te ondersteunen, zijn wij drie jaar geleden samen met Dell het ILSE lab begonnen. ILSE staat voor ‘Innovation Lab for Research and Education’. Samen kijken we naar technieken die eraan komen en experimenteren in het lab. Daar draait ook het ODDS ecosysteem op. Onderzoekers hebben vaak niet de hardware en rekenkracht beschikbaar om hun aannames te toetsen en dat kan wel in deze omgeving. Is een onderzoek afgerond, de whitepaper geschreven en/of het onderzoeksrapport gepubliceerd, dan moet men vertrekken uit de omgeving. Als men wel de oplossing in productie wil nemen kunnen wij helpen met advies.”
Jaco van Dijk, Advisory Solutions Architect bij Dell Technologies is nauw betrokken bij het ecosysteem en het innovatielab. “We werken al jaren samen met universiteiten om bewezen experimenten naar de industrie te brengen. Zo is ook het ODDS ecosysteem ontstaan. Ik ben al jaren bezig met data en was van mening dat data-uitwisseling niet zo ingewikkeld hoeft te zijn. Het zou toch mogelijk moeten zijn om uniformiteit te creëren om data te benaderen? Als data veilig uitgewisseld wordt en van de eigenaar blijft, dan zijn er enorme voordelen te behalen. Het ODDS ecosysteem draait daarom op een unieke combinatie van software, web3- en blockchain technieken. Daarmee zijn diverse business cases geleverd waardoor inmiddels al het nodige in productie draait. De visserij is daar een mooi voorbeeld van. Door het ecosysteem kan data van de sensoren op schepen, gecombineerd worden met maritieme data. Daarbij wordt als het ware de conclusie van de data gedeeld, maar de eigenaar blijft de visser zelf in geval van de sensoren bijvoorbeeld. Zo kan het schip sneller naar de juiste plaats varen, wat C02 en tijd bespaard. En kan tevens nauwkeurig gerapporteerd worden hoeveel en welke type vis uit de zee wordt gehaald naar de overheidsinstanties. De overheid kan echter niet bij alle gegevens van de visser.”
Jaco vervolgt: “Door onder andere Web3 techniek toe te passen garanderen we dat data altijd beschikbaar blijft, doordat data op meerdere plekken veilig wordt neergezet. Dit beperkt ook meteen de ‘macht’ van grote techreuzen bijvoorbeeld en van overheden. Deze grote techbedrijven kunnen minder met de data omdat deze op verschillende plekken staat en zij enkel een stukje van de data krijgen. We zijn nog volop in ontwikkelingen en werken nu bijvoorbeeld aan het afrekenmodel op basis van blockchain, waarbij je iemand ook betaald voor de tijd en rekenkracht die je gebruikt van zijn servers. Je kan daarbij zelf aangeven wat de regels en richtlijnen zijn waar je toegang en ruimte voor biedt. Gebruikt iemand jouw omgeving tegen de regels in, dan krijgt deze een bounce. Is er geen ruimte beschikbaar dan wordt een andere server in het netwerk gezocht.”
“De veiligheid van data wordt hierdoor tevens vergroot. Voor hackers wordt het door de gecombineerde technologieën namelijk lastiger om over de data te beschikken. Als het al lukt om een blokje data te gijzelen, dan kan het systeem dit herkennen, het blokje weghalen en de data herstellen met een blokje van een andere plek. Waardoor de gijzeling teniet wordt gedaan. Als data op verschillende plekken staat, is het tevens minder makkelijk om zaken offline te halen. De techniek kan altijd stukjes terughalen en websites weer in te lucht brengen. Overheden die het niet zo nauw nemen met persvrijheid of juist informatie enorm willen reguleren hebben met deze technieken ook minder kans van slagen. Dat overheden en grote techreuzen minder blij zijn met al deze ontwikkelingen, snap ik wel. Voor gebruikers en eigenaren van data is het des te prettiger", aldus Jaco van Dijk.
Inmiddels hebben ook Cambridge University en bedrijven in Australië en Amerika interesse getoond in het ODDS ecosysteem. Momenteel wordt dan ook hard gewerkt aan de migratie instructies en omgevingsvoorwaarden zodat het ecosysteem buiten onze landsgrenzen gebruikt kan gaan worden. Daarmee is het Open Data for Data Science ecosysteem een belangrijke innovatie om in te gaten te houden.
Door: Tispha Barbier-Offerhaus van Infinity IT