03 februari 2025

DATA; Als je er kennis uit wilt halen….

Ongetwijfeld bent u bekend met het verhaal van de chatbot die gebruikt werd door advocaten om hun case rond te krijgen met jurisprudentie. Waarom minutieus met een simpele zoekmachine bestaande jurisprudentie bij elkaar zoeken als ChatGPT dat ook voor je kan doen? Helaas, in de rechtbank bleek al snel dat de beleefde, hulpvaardige en creatieve Chatbot deed wat er verwacht werd, antwoorden geven. Helaas was alle jurisprudentie verzonnen.

DATA; Als je er kennis uit wilt halen…. image

In de M&I ICT Benchmark Gemeenten 2024 is een klein hoofdstuk ingeruimd voor AI. We zitten in een verkennende fase, er is informeel individueel gebruik door medewerkers van AI tools als ChatGPT en Copilot. Er is interesse, maar er is nog steeds een gebrek aan capaciteit en kennis.

Datagedreven werken

In hetzelfde rapport is veel ruimte voor initiatieven rond Datagedreven werken en we weten inmiddels dat nog maar weinig gemeenten durven zeggen dat ze dit al ingevoerd hebben. Sterker nog, uit hetzelfde rapport blijkt dat er nog een fiks aantal gemeenten zijn die nog helemaal niet in staat zijn om datagedreven werken te implementeren. Het schort aan menskracht, tijd en budget om hier echt mee aan de slag te gaan.

Is het fout om te denken dat één van de belangrijkste redenen dat datagedreven werken bij veel gemeenten nog in de kinderschoenen staat omdat het ontbreekt aan een datastrategie, datamanagement en een serieus datamodel? Niet voor niets is er heel veel aandacht voor initiatieven als het Gemeentelijk Gegevens Model (GGM) en IRMA, het Informatiebeheer Referentie Model Architectuur van de gemeente Den Haag. Het besef groeit dat we eerst een slag moeten maken waarbij we alle belangrijke gegevens rubriceren en koppelen aan domeinen en processen. Dat we valideren dat de gegevens volledig, correct en bijgewerkt zijn, dat er een eigenaar is en wat voor soort gegevens het zijn (intern, extern, privacy gevoelige data, etc.).

De tweede stap is natuurlijk om, voor de gegevens die we niet direct beschikbaar hebben, een integratie architectuur moeten definiëren. In de praktijk blijkt dan regelmatig dat er nog heel veel gegevens verstopt zitten in SaaS applicaties of dat het gegevens betreft die opgeslagen zijn bij een zelfstandig bestuursorgaan, partner, provincie, een leverancier of onderwijsinstelling. Terwijl we die gegevens toch echt ook nodig hebben om datagedreven te werken.

Het is voor niemand een verassing dat we pas een BI omgeving op kunnen zetten als aan al deze voorwaarden voldaan wordt. Want pas dan kunnen we vertrouwen dat we werkelijk over de gegevens beschikken die we nodig hebben om datagedreven te kunnen werken.

AI weet veel, en weinig

Alle LLM (Large Language Models) implementaties zoals ChatGPT en Copilot hebben geen weet van de instelling waar jij werkt. Ze hebben miljoenen bronnen, ergens op het internet, gebruikt als leermateriaal en gebruiken algoritmes om onze vragen te begrijpen en er een antwoord op te geven. Generieke vragen als “Kun je dit PDF document samenvatten tot één kantje en, oh ja, hou het een beetje simpel”, zullen dan ook uitstekende resultaten geven.

Op vragen die specifiek zijn voor jouw organisatie zal ChatGPT echter geen goed antwoord kunnen geven. En dat is niet zo vreemd als je bedenkt dat de onderliggende kennis (alle data die je eerst in een datawarehouse moet stoppen om er met een BI oplossing zinnige antwoorden uit te krijgen) niet aan ChatGPT is aangeboden als “leerstof”. En dat is misschien maar goed ook…

Geen organisatie is gelijk

Een voorbeeld; een gemeente in Noord-Holland heeft met andere variabelen te maken dan een gemeente in Noord-Brabant. Bij een bedrijf dat werkt met hoog opgeleide medewerkers zal de HR afdeling zich met hele andere vraagstukken bezighouden dan bij een bedrijf dat een sociale functie heeft en met licht geestelijk gehandicapten werkt. Een kleine gemeente in de polders zal zaken die betrekking hebben op de omgevingswet anders beoordelen dan een middelgrote gemeente in een bosrijke omgeving. ChatGPT zal haar/zijn best doen, maar u zult nooit de antwoorden op beleidsvragen krijgen die specifiek zijn voor uw situatie.

Natuurlijk gaat dat in de toekomst wel gebeuren wanneer je de beschikking hebt over een eigen instance of een afgeschermd deel van een LLM model!

Stap-voor-stap

Voordat je gaat rennen moet je eerst leren lopen. En zoals we in de M&I Benchmark kunnen lezen zijn nog maar weinig gemeente zover dat ze datagedreven kunnen werken. Dat betekent simpelweg dat de informatiehuishouding (nog) niet op orde is. De logische stappen om van data via informatie naar kennis en intelligentie te komen zijn nog niet genomen en er kan geen stap overgeslagen worden. Dit lijkt eenvoudig, met de technologie van vandaag en de opgebouwde kennis van 40+ jaar informatie technologie zouden we ver moeten kunnen komen.

De praktijk is helaas weerbarstiger. Als er op de simpele vraag; “welke privacy gevoelige gegevens hebben we binnen onze organisatie, wat is de bron van deze gegevens, door wie worden ze gemuteerd en als er een kopie gemaakt wordt, waar blijft die dan?” geen eensluidend antwoord gegeven kan worden dan zegt dat toch voldoende?

Lessen uit het verleden

De lessen uit het verleden zijn hard (duur), maar leerzaam. De belangrijkste reden dat veel BI projecten niet opleverden wat men er van verwachtte lag niet aan de technologie, maar aan de data. Wie kent niet de BI tools waar je als gebruiker de keuze hebt uit 3 verschillende contractnummers, 5 verschillende entiteiten met de omschrijving “Eind datum” en meerdere velden waar het woord “Contract waarde” in staat. Om vervolgens, na veel gepruts, van een collega te horen dat je voor een verkoopcijfers niet het veld “Contract nummer” moet gebruiken maar “Contract-nummer”.. Het is maar een voorbeeld, maar de situatie is voor iedereen herkenbaar.

Hallucineren

Eerst een datastrategie en een gegevensmodel voor de hele organisatie. Pas dan weet je welke gegevens je hebt of via een gedegen integratiearchitectuur kunt ophalen. Daarna kun je die gegevens verzamelen en met een BI hulpmiddel bevragen. En pas als DAT werkt is het tijd om aan een afgeschermde AI tool dat alleen gebruikt kan worden binnen uw organisatie, die genormaliseerde gegevens aan te bieden als leerstof. Want van 3 verschillende contractnummers zal ook een AI oplossing over 4 jaar nog stevig gaan hallucineren.

Hulp

De specialisten van Enable U kunnen u helpen bij het opzetten van een data-architectuur, een integratiestrategie en alle stappen die er voor nodig zijn om uw organisatie klaar te stomen voor AI. Of u nu wilt starten met datagedreven werken of al flinke stappen hebt gezet, uw ICT omgeving veranderd zo snel dat u zonder data- en integratiestrategie al weer snel achter feiten aan zult lopen. Neem gerust contact met ons op en samen zorgen we er voor dat u over niet al te lange tijd met vertrouwen AI voor uw organisatie kan laten werken.

Door: Marcel den Hartog, Trend & Development Expert bij Enable U

Avepoint Gold awards 03/02/2025 t/m 10/02/2025 BN + BW DIC Awards 5/12/2024 t/m 20/03/2025 BW
Avepoint Gold awards 03/02/2025 t/m 10/02/2025 BN + BW

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!