AI gepositioneerd binnen de Architectuur
Met CommonKads kunnen we neurale netwerken leren denken, net als mensen
De afgelopen jaren hebben neurale netwerken als ChatGPT grote vooruitgang geboekt. Maar er is heel veel data nodig om modellen te trainen terwijl mensen met minder voorbeelden kunnen leren. Mensen zijn bedreven in het leren van nieuwe concepten en het systematisch combineren ervan met bestaande concepten. Als een kind bijvoorbeeld eenmaal leert springen, kan het dankzij zijn compositorische vaardigheden begrijpen hoe het achteruit moet springen of twee keer rond een kegel moet springen. Neurale netwerken ontberen dit soort systematiek en zijn daarom geen plausibele cognitieve modellen. Neurale netwerken kunnen systematischer zijn door ze te integreren in de architectuur.
AI en het Orakel van Delphi
AI wordt getraind met astronomische hoeveelheden data, met als gevolg dat het op elke vraag wel een antwoord weet. Maar zijn deze antwoorden feitelijk correct en onbevooroordeeld? Brenden Lake en Marco Baroni (Nature, 25/10/2023) hebben een methode ontwikkeld waarin kunstmatige intelligentie beter kan generaliseren en zo mogelijk sneller kan leren. De onderzoekers gebruiken hierbij een techniek die meta-learning wordt genoemd. Het idee van meta-learning bestaat al sinds de jaren negentig. Sinds de laatste jaren zijn neurale netwerken zover ontwikkeld dat ze deze compositionaliteit aankunnen. CommonKads (https://commonkads.org) is een methode die in de jaren 90 is ontwikkeld door de Universiteit van Amsterdam. CommonKads biedt een aantal instrumenten waarmee (kunstmatige) intelligentie in de architectuur geïntegreerd kan worden op basis van meta-learning.
Commonkads, methode voor meta-learning
CommonKads onderkent een aantal kenniscategorieën. Kennis wordt hierbij beschouwt als meta informatie, informatie over informatie. Er wordt hierbij geen harde grens getrokken tussen informatie en kennis. Kennis wordt beschouwd als semantisch rijke informatie.
Kennistaken vormen de eerste categorie. Kennistaken zijn doelgericht en kennen, net als bedrijfsprocessen, een functionele decompositie. Kennistaken laten zich goed integreren in een bedrijfsproces binnen de bedrijfsarchitectuur. Domeinkennis is de tweede categorie. Domeinkennis bevat alle relevante kennis en informatie. Domeinkennis is statisch van aard en beperkt zich tot een domein. Tenslotte wordt inferentiekennis benoemt. Deze bevat de redeneerstappen welke met de domeinkennis worden uitgevoerd, binnen de kaders van een kennistaak.
Template voor een diagnose kennistaak
CommonKads heeft een aantal patronen ontwikkeld voor kennistaken. Er wordt hierbij onderscheid gemaakt naar analytische taken en synthese taken. Analyse houdt zich primair bezig met het genereren van inzichten die de ontwikkeling van nieuwe producten, diensten en communicatie stimuleren. Synthese houdt zich bezig met het genereren van oplossingen die inwerken op de inzichten die zijn ontwikkeld in de analyse. Analytische taken bevatten activiteiten als classificatie, assessment, diagnose, monitoren en voorspellen. Synthese taken omschrijven activiteiten als ontwerpen, modelleren, planning & scheduling of assignments.
Door de hoeveelheid data of kennis te beperken tot een specifiek domein, bijvoorbeeld data gerelateerd aan medische diagnoses, en daarnaast op basis van de patronen een afleiding te beperken tot een denkstap of inferentie, kan een neuraal netwerk veel sneller getraind worden. Daarnaast worden de afzonderlijke denkstappen afzonderlijk getraind. Binnen de medische diagnose kan het neurale netwerk zo getraind worden om vanuit de klacht en persoonlijke gegevens van een client de relevante hypotheses af te leiden. Tevens is het mogelijk om het netwerk te trainen op de gehele diagnosetaak. In het verleden is geprobeerd redeneringen in kennissystemen op te zetten welke gebaseerd waren op waarschijnlijkheid (MYCIN). De uitkomsten van deze diagnoses bleken onbetrouwbaar (20-30% false positives). Door het neurale netwerk zowel op inferentiestappen als op de gehele kennistaak te trainen kunnen deze afwijkingen geminimaliseerd worden.
Samenvattend kent het gebruik van meta-learning binnen de architectuur de volgende voordelen:
- Met behulp van AI worden cognitieve modellen opgesteld die zich goed laten integreren in de architectuur. Hierdoor worden redeneringen transparant, uitlegbaar en herleidbaar.
- De hoeveelheid benodigde data wordt drastisch beperkt hetgeen substantieel minder energie voor het trainen van het netwerk kost.
- Doordat er minder data benodigd is, kunnen organisaties de ontwikkeling van hun AI zelf ter hand nemen, zonder deze over te laten aan grote bedrijven zoals Google of Meta.
- Kennistaken laten zich inpassen als capabilities binnen de architectuur
- Organisaties hebben betere controle over de wijze waarop met hun data wordt omgesprongen met inachtneming van privacy en security eisen.
Eén gek kan meer vragen dan tien wijzen kunnen beantwoorden
De huidige AI lijkt gebruik ter maken van dit gezegde. Op statistische wijze worden antwoorden afgeleid op elke vraag die je maar kunt verzinnen. De meeste organisaties worden niet bemenst met gekken, maar met professionals. Deze willen transparante, uitlegbare en herleidbare antwoorden op hun vraagstukken. Dit vereist een gerichte training van neurale netwerken op domeinen welke relevant zijn voor de organisatie.
Wat Solventa betreft vormen AI en Neurale Netwerken integraal onderdeel van de data-/-informatie architectuur binnen een (data gestuurde) organisatie.
Wat Solventa betreft vormen AI en Neurale Netwerken integraal onderdeel van de data-/-informatie architectuur binnen een (data gestuurde) organisatie. Door gebruik te maken van concepten als meta-learning kan AI beter geïntegreerd worden in de architectuur. Door kleinere modellen slimmer te trainen, worden ze beter inzetbaar binnen de organisatie en kunnen ze beter in de architectuur ingepast worden.