De afgelopen 10 jaar zijn er op het gebied van het verwerken van natuurlijke taal, het gebruik van complexe algoritmen en machine learning grote stappen gezet. In dit artikel belicht ik twee praktijkvoorbeelden waarbij gebruik gemaakt wordt van een combinatie bovenstaande technieken, namelijk ‘Agent Technology’ en ‘Contract Mining’.

 

NLP, A.I., MACHINE LEARNING… WAT IS HET?

Automatiseringsoplossingen zijn van oorsprong erg goed in rekenen en werken met tabel gestructureerde data. Waar computersystemen ten opzichte van mensen minder goed in zijn is het verwerken van taal en maken van inschattingen op basis van ervaringen en context. Met technieken als Natural Language Processing (NLP) en A.I. proberen we deze kloof te dichten.

NLP technieken stellen ons in staat om concepten en relaties en daartussen te herkennen. Ter illustratie; het concept geld betekent voor een mens heel veel (ruilmiddel, valuta, koers etc). Voor een computer is dit minder vanzelfsprekend. Dit zal dus de computer moeten worden aangeleerd door gebruik te maken van verschillende technieken zoals annotatie, dictionary matching, word embeddings, knowledge graphs etc. Hierbij is context een belangrijke bepalende factor in het geven van betekenis en relevantie. Uit de enorme hoeveelheid ongestruc- tureerde data is met de tooling (bijvoorbeeld Hadoop, Spark, IBM Watson, ElasticSearch) en beschikbare algoritmen (bijvoorbeeld MapReduce) tegenwoordig heel veel af te leiden en verwerken.

ECHT VOLLEDIG AUTONOOM ZELFLERENDE SYSTEMEN HEBBEN NOG BEHOORLIJK WAT BEPERKINGEN

Naast NLP is ook A.I. (Artificial Intelligence) een veel aangehaald begrip. Hierbij heeft men het ook vaak over zogenaamde cognitieve of zelf- lerende systemen. Echt volledig autonoom zelflerende systemen hebben nog behoorlijk wat beperkingen. Meer relevant zijn momenteel getrainde systemen en systemen die in samenhang met echte experts en gebruikers steeds beter worden via aanpassing en correctie (zogenaamde closed loop learning).

Om (zelf) lerende systemen (A.I.) mogelijk te maken is het nodig om de computer kennis bij te brengen. Hiervoor gebruiken we een breed scala aan technieken, die samenvallen onder de noemer Machine Learning (ML). ML technieken hebben hun wortels in de wiskunde en statistiek en behelzen vaak het vinden van een optimale set gewichten voor een groot aantal factoren waarmee een numerieke (bijvoorbeeld ‘Hoeveel fraudegevallen zijn er te verwachten in een set transacties?’) of categorische (bijvoorbeeld ‘Is een bepaalde transactie frauduleus of niet frauduleus?’) voorspelling gedaan kan worden op basis van een nieuwe data set. De meerwaarde van ML (ten opzichte van rule-based systemen) is het vermogen om complexe (vaak niet-lineaire) verbanden te vinden tussen een dusdanig groot aantal factoren dat door de mens niet meer te overzien is.

HOEVEEL FRAUDEGEVALLEN ZIJN ER TE VERWACHTEN IN EEN SET TRANSACTIES?

De combinatie van verschillende methoden en technieken op het gebied van NLP en A.I. maakt het mogelijk om processen op een andere manier te organiseren. Bijvoorbeeld door grote hoeveelheden tekst- gebaseerde data te verwerken of door een betere interactie te realiseren tussen mensen en systemen (dialoog gedreven systemen).

TOEPASSINGEN IN DE PRAKTIJK

Er zijn verschillende verschijningsvormen van agents, variërend van chatbots tot decision support tot offline agents die voor je kunnen handelen. Hiernaast een voorbeeld ter illustratie.

Travel bot

In het plannen en doorlopen van een reis is er een grote informatie- behoefte: ‘Hoe laat vertrekt de vlucht?’, ‘Welke gate?’, ‘Hoe laat moet je aanwezig zijn?’, ‘Waar te parkeren?’, et cetera. Traditioneel lossen we dit op door vraag en antwoord sets te maken (Q&A pairs) en vervolgens dialogen te scripten voor veel voorkomende vragen. Een belangrijke beperking van deze aanpak is dat je nooit alle vragen vooraf kunt scripten en dat je belangrijke context voor de beantwoor- ding van de vragen vaak mist. Daarnaast is de interactie vaak nogal houterig omdat deze volledig is vastgelegd en vrij algemeen.

De oplossing hiervoor is een non-linear conversational bot: een opzet waarbij de bot voor één of meerdere topics is getraind (een afgebakend en specifiek domein) waarbij thema’s, relaties, hiërarchieën et cetera zijn opgenomen in een meer complex model dan we op basis van alleen scripten zouden kunnen realiseren. Je bouwt de bot zodat deze vanuit de modellen en onderliggende kennis de intent achter de initiële vraag kan herleiden en via validatie en relaties tussen belangrijke concepten vervolgens in dialoog de gebruiker door bepaalde materie heen leidt. Het resultaat is een systeem met een referentiekader dat bij meer traditionele systemen (door de gebruiker) wel vaak verondersteld wordt aanwezig te zijn, maar in werkelijkheid vaak ontbreekt. De non-linear conversational bot is daarmee een krachtig middel om in te zetten in informatie- of kennisintensieve processen.

Contract Mining

Binnen veel organisaties zijn er nog grote afdelingen waar repeterend kenniswerk gedaan wordt. Voorbeelden zijn: claims management (ziektekosten, schade), aanvragen (vergunningen, leningen, certifi- caten), handelsdocumenten (kredietbrieven, douanedocumenten, contracten) en wet-en regelgeving (notariële akten, wetten, jurispru- dentie). Hierbij gaat het om het interpreteren van binnengekomen

stukken (verzoek, voorstel)) en het toetsen aan de interne kaders (bijvoorbeeld conditiestelsels, compliance-eisen, risicomatrix).
De complexiteit en diversiteit van ongestructureerde data en docu- menten is vaak te groot om eenvoudig geautomatiseerd te verwerken en daarom gaat dit via experts en afdelingen die veel kennis en ervaring hebben en dit direct kunnen toepassen.

DIT SOORT TECHNIEKEN IS GEEN VERVANGING VOOR RULE-BASEDSYSTEMEN MAAR EEN AANVULLING OP DIT SOORT SYSTEMEN

De toepassingen zijn zoals opgesomd divers maar toch zijn er veel overeenkomsten;
– gesloten domein (overzichtelijke binnenwereld met heldere kaders en regels);
– diffuus karakter van hoe vragen en verzoeken binnen komen (dus niet altijd eenvoudig 1-op-1 te matchen);
– ondanks overzichtelijke binnenwereld geen overkoepelend (meta-) model aanwezig (is typisch onbenoemd/ ervaring);
– teveel om handmatig te verwerken waardoor er vaak geen 100% controle mogelijk is(dus steekproeven);
– in de oplossing komen kennis van de gebruiker en het vermogen om meer te kunnen verwerken samen.

Voorbeelden van toepassingen van contract mining zijn een aanvraag voor een lening en daaronderliggende risicoinschatting en analyse van contracten in vastgoed (notariele aktes, contracten en portefeuiles).

Voorbeeld aanvraag lening

In de controle van onderliggende overeenkomsten met derden moet getoetst worden of er geen inbreuk gemaakt wordt op de primaire overeenkomst die de kredietverstrekker met de klant heeft. Hierbij let men op verschillende concepten in de ‘contracten derden’ zoals verpanding, uitgestelde betalingen, retentierecht et cetera en zal men dit soort concepten willen toetsen tegen het eigen conditiestelsel.

We trainen hier een systeem ten eerste op de overzichtelijke binnenwereld: bepaalde producten tegen bepaalde condities op een bepaalde wijze af te nemen. Daarnaast gaan we de belangrijkste concepten benoemen en classificeren met de inhoudelijke experts. Het gaat hierbij dus om het herkennen van het construct ‘verpanding’ en niet om het letterlijk vinden van alleen dit woord. Het resultaat is een systeem dat in staat is grote hoeveelheden tekst te analyseren en matchen op de getrainde concepten en deze compact te presenteren aan de expert met een inschatting (matching %) per thema) en onderliggende bewijsvoering (waar in de documenten gevonden). Hierdoor kan een expert via een paar spot-checks het dossier sneller verwerken. Het is hierbij ook mogelijk dat op basis van de spot-check verbeteringen en correcties in de modellen worden doorgevoerd en het systeem zo verder wordt ontwikkeld.

Belangrijk om te onderkennen in dit soort procesinnovatie is dat de toepassing van dit soort technieken geen vervanging is voor rule- basedsystemen maar een aanvulling op dit soort systemen. Ook leidt het niet per sé tot een 100% automatisering maar betreft het vaak een voorbewerking van meer specifiek en hoogwaardig kenniswerk of een slimmere vorm van mens-machine interactie om beter en meer te kunnen verwerken. ■

 

*bron artikel:  https://www.ag-ai.nl/view/37325-25-3-art.vdHulst.pdf
 
 

Wilt u meer weten over Agent Technology & Contract Mining? Wij helpen u graag verder, neem dan contact op met Jibes via info@jibes.nl

Jibes is specialist in data related issues.