IBM werkt aan verbetering natuurlijke taalverwerking

03-08-2019 | door: Blogger

IBM werkt aan verbetering natuurlijke taalverwerking

IBM werkt aan de bevordering van natuurlijke taalverwerking ofwel Natural Language Processing (NLP) voor bedrijfsdomeinen. Dit meldt Salim Roukos, IBM Fellow & CTO Translation Technologies bij IBM Research.

Roukos meldt: "Informatie vinden in de enorme hoeveelheid documenten en kennisbanken van een bedrijf om vragen van gebruikers te beantwoorden, is nooit zo eenvoudig als het zou moeten zijn. De antwoorden kunnen heel goed bestaan, maar ze blijven vaak om een aantal redenen buiten bereik.

Om te beginnen, in tegenstelling tot internet, waar informatie is verbonden via een rijke set links en vaak redundant wordt vastgelegd in meerdere vormen (waardoor het gemakkelijker te vinden is), wordt enterprise-inhoud meestal opgeslagen in silo's met veel minder herhaling van belangrijke informatie. Bovendien stellen gebruikers die op zoek zijn naar bedrijfsinhoud doorgaans ingewikkelde vragen en verwachten ze gedetailleerdere antwoorden dan ze zouden krijgen van een webzoekmachine. Dit kunnen vragen zijn over productondersteuning, facturen, de nieuwste regelgeving voor contracten met klanten, de implicaties van evenementen die op nieuwssites zijn ontdekt, enzovoort. Ten slotte zijn bedrijven vaak terughoudend om te vertrouwen op de 'black box'-AI die de aanbevelingen niet kan verklaren en die technieken vereisen die kunnen worden uitgelegd aan besluitvormers of eindgebruikers.

Enterprise NLPNatuurlijke taalverwerking (NLP) belooft veel om zulke diepgaande informatie in bedrijfsinhoud te vinden door gebruikers in staat te stellen hun informatiebehoeften vrijer te uiten en nauwkeurige antwoorden te geven op steeds complexere vragen. NLP-systemen voor ondernemingen worden echter vaak uitgedaagd door een aantal factoren, waaronder het begrijpen van heterogene informatie-silo's, het omgaan met onvolledige gegevens, het trainen van nauwkeurige modellen van kleine hoeveelheden gegevens en het navigeren in een veranderende omgeving waarin nieuwe inhoud, producten, voorwaarden en andere informatie wordt continu toegevoegd.

IBM Research AI onderzoekt langs drie verschillende thema's om deze uitdagingen aan te gaan en NLP voor bedrijfsdomeinen te verbeteren. De eerste is gericht op het bevorderen van AI waarbij systemen kunnen leren van kleine hoeveelheden gegevens, externe kennis kunnen benutten en technieken kunnen gebruiken die neurosymbolische benaderingen van taal omvatten die neurale en symbolische verwerking combineren. De tweede is gericht op het vertrouwen op AI waar uitleg wordt gegeven over hoe een systeem tot een beslissing komt. De derde benadering omvat het schalen van AI om continue aanpassing en betere monitoring en testen van systemen mogelijk te maken ter ondersteuning van de inzet van taalsystemen onder de strenge verwachtingen van ondernemingen.

In mijn post op Towards Data Science geef ik informatie over het NLP-werk van IBM Research door vier papers te markeren die we presenteren op de ACL 2019-conferentie. De eerste twee artikelen hebben betrekking op semantische parsing: de eerste gebruikt de taal 'Abstract Mean Representation' (AMR) om de betekenis van een zin weer te geven, en de tweede maakt een semantische parser die de vraag van de gebruiker omzet in een programma om een kennisbank op te vragen. Ik onderzoek ook kort ons werk door onvolledige kennisbanken met tekst te integreren om de dekking bij het beantwoorden van vragen te verbeteren. Het vierde artikel beschrijft een systeem waarmee vakdeskundigen de regels kunnen verfijnen voor een interpreteerbaar, op regels gebaseerd systeem."

Lees het Towards Data Science artikel hier .

Terug naar nieuws overzicht