Blogs

Baanbrekende technologie brengt IDP naar niveau van de Champions League

Baanbrekende technologie brengt Intelligent Document Processing naar niveau van de Champions League

‘Je moet het zien om het te geloven’

Rogier Schippers, Manager Business Development voor Docspro, ging eens goed in zijn stoel zitten toen hij deze nieuwe toepassing van op AI gebaseerde Intelligent Document Processing (IDP) zag. ‘Johan Cruijff zei het al’: je moet het zien om het te geloven. Met deze nieuwe technologie zijn we in staat om echt nagenoeg 100 procent van alle ongestructureerde informatie geautomatiseerd te herkennen en te verwerken. En daarmee belangrijke bedrijfsprocessen een grote kwaliteitsimpuls te geven. We zitten nu in de Champions League.’

Eens in de zoveel tijd gebeurt het. Dan komt er een technologie of een ontwikkeling op je pad die daadwerkelijk in staat is de IT-markt op zijn kop te zetten. Rogier: ‘IDP is er al langer, dat weten we. Op een slimme manier documenttypen herkennen en daarnaar handelen in de vervolgverwerking (bijvoorbeeld door het zoeken naar bepaalde gegevens) is niet nieuw voor ons. Daar zijn belangrijke ontwikkelingen in geweest, zoals Machine Learning en Robotic Process Automation die ons steeds verder hebben gebracht als het gaat om het automatiseren en intelligenter maken van documentverwerkingsprocessen. Deze nieuwe toepassing, Intelligent Document Processing driven by AI, is echter de overtreffende trap. Toen ik dat aan het werk zag ging ik echt eens even goed in mijn stoel zitten …’

Wilt u op de hoogte blijven van de trends en ontwikkelingen? Volg ons dan via LinkedIn of nieuwsbrief.
LinkedIn Nieuwsbrief

Artificial Intelligence

De opkomst van Artificial Intelligence (AI) zal niemand zijn ontgaan. Rogier: ‘Met name een van de recente en meest aansprekende ontwikkeling, ChatGPT, heeft alle voorpagina’s gehaald. Met goed nieuws en minder goed nieuws. Laat nou de bron van die toepassing, het gebruik van Large Language Models (LLM), de basisvormen voor wat we zien in deze AI gebaseerde IDP-oplossing. De ontwikkelaars ervan zijn in staat geweest om een toepassing te maken die ons in staat stelt om complexe en ongestructureerde informatie op een heel intelligente manier te herkennen en te analyseren. Vervolgens kunnen we daar interactief mee ‘communiceren’ om bepaalde informatie eruit te halen, inzichten te creëren, kortom, meer te begrijpen van wat we hebben. Dat klinkt heel bizar, maar dit betekent een belangrijke doorbraak om (weer) grip te krijgen op die grote hoeveelheden complexe ongestructureerde informatie die elke dag op ons af komen. Dit is nu wat je noemt een echte disruptive technology…’

Large Language Models

Wat zijn dat dan, die Large Language Models? Rogier: ‘Een Large Language Model is een type kunstmatige intelligentie die is getraind om menselijke taal te begrijpen, te genereren en te manipuleren. Een LLM kan verschillende taken op het gebied van natuurlijke taalverwerking uitvoeren. Zoals het genereren en classificeren van tekst, het beantwoorden van gespreksvragen en het vertalen van tekst van de ene taal naar de andere. De term ‘Large’ verwijst naar het aantal waarden (parameters) dat het model tijdens het leerproces zelf kan aanpassen. Sommige van de meest succesvolle LLM’s hebben honderden miljarden parameters. Het bekendste voorbeeld is, zoals ik al aangaf, ChatGPT.’

‘Een belangrijk kenmerk van LLM is dat deze groter worden. Dit betekent dat die modellen voortdurend kunnen evolueren en beter kunnen worden in het begrijpen en genereren van menselijke taal naarmate ze meer worden getraind op nieuwe gegevens. Hierdoor kunnen ze worden gebruikt voor een breed scala aan toepassingen, zoals virtuele assistenten, chatbots, tekstgeneratie, automatische samenvattingen genereren en meer. Heel mooi natuurlijk, zeker die laatste twee toepassingen, maar er zijn ook (delen van) toepassingen die we niet willen.’

Intelligentie beperken is deel van de kracht

Met het gebruik van deze LLM-toepassingen zijn namelijk ook wel nadelen te benoemen. Rogier: ‘De kunst van Artificial Intelligence is uiteraard dat die steeds verder zelf gaat ‘redeneren’ en in staat is zelf nieuwe tekst te genereren. Dat is voor onze klanten echter niet de bedoeling. Stel, je hebt een grote, complexe verzameling ongestructureerde, juridische documenten die je met deze AI-toepassing gaat analyseren. Dan wil je daar vervolgens een inhoudelijk correcte samenvatting van hebben. Of je wilt een set documenten met specifieke onderwerpen of met specifieke inhoud binnen die verzameling oproepen. Dan mag het systeem daar natuurlijk niet zelf iets aan toevoegen of er een eigen interpretatie aan geven. De kracht van deze applicatie zit in dit geval juist in de beperking die eraan is gegeven: je mag alleen teksten genereren op basis van wat er in de verzameling aanwezig is. Het mooiste is dat je als gebruiker een vraag kunt stellen: Waar in het document staat… Of maak een samenvatting van dit dossier in het Engels. Zo’n dossier kan namelijk uit documenten in meerdere talen bestaan. In de juridische markt is dat zeker niet ongewoon. LLM is meertalig, zoals ik al aangaf. Die is in staat al die documenten te analyseren, ongeacht de taal. Daarmee kun je een hele complexe verzameling documenten ‘uitvragen’. Die interactie, naast de intelligentie, maakt deze toepassing zo sterk.’

Baanbrekend

Door de intelligentie van het systeem ben je als gebruiker in staat om documentverwerkingsprocessen slimmer, sneller en accurater te doorlopen, met minder moeite en een beter resultaat. Deze combinatie van data- en taalwetenschap, procestechnologie en AI brengt ons heel dicht bij de perfecte score als het gaat om het geautomatiseerd analyseren en interpreteren van de inhoud van grote hoeveelheden complexe, ongestructureerde informatie. Dat komt mede door de snelle leercurve. ‘In plaats van een hele serie voorbeelddocumenten door het systeem te loodsen om een systeem te laten ‘leren’, stel je simpelweg vragen (ook wel prompts genoemd) om bepaalde gegevens te herkennen, aldus Rogier. ‘Niet alleen met betere resultaten, maar ook gelijk in het gewenste formaat of taal. Dit maakt de inrichting van processen waarin zeer ongestructureerde documenten in voorkomen vele malen eenvoudiger en betrouwbaarder. De truc is om de juiste prompt te definiëren voor het stuk metadata wat herkend moet worden. De combinatie van IDP met de intelligentie van GPT maakt het een ijzersterke toepassing. Dit is echt baanbrekend voor de markt’

Bovenkant markt

Wat betekent dit voor de bestaande toepassingen op het gebied van Intelligent Document Processing? Rogier: ‘Die zullen blijven bestaan. We blijven met Docspro uiteraard onze bestaande IDP-implementaties doen. Niet elke documentverzameling hoef je namelijk direct met deze specifieke AI-toepassing te verwerken. Sterker nog, vooral markten waar grote hoeveelheden ongestructureerde en complexe documenten rondgaan, is deze applicatie echt goed geschikt. In de financiële dienstverlening, de overheid of in de juridische sector, om er maar een paar te noemen, biedt deze toepassing een belangrijke kans op verbetering van de kwaliteit van die dienstverlening en verhoging van de efficiency van content gerelateerde bedrijfsprocessen.’

Deel dit met vrienden!