Kennis onttrekken uit databases kan van belang zijn bij het nemen van beslissingen. Daarbij gaat het bijvoorbeeld om risicobeoordeling in verzekeringsaanvragen, het succes voorspellen van de introductie van een nieuw product of de vraag welke werknemers het beste ingezet kunnen worden op een bepaald project. Problabilistische netwerken bieden volgens een consultant van ID Research uitkomst waar neurale netwerken en regelgebaseerde systemen het laten afweten.
Een effectief gebruik van de kennis die in databases besloten ligt, vereist de mogelijkheid tot het ontsluiten, structureren en organiseren ervan. Dat verklaart de enorme belangstelling voor kennismanagement en datamining-technieken. Die zijn er immers op gericht om de aanwezige kennis beschikbaar te maken voor gebruik in de bedrijfsprocessen.
Het resultaat van kennismanagement en datamining is kennis van de factoren die van belang zijn voor het nemen van een beslissing. Voor een aanvraag van een autoverzekering is leeftijd zo’n factor: een jeugdige leeftijd leidt tot een groot risico.
Het toepassen van kennis vergt het gebruik van een of andere techniek. Neurale netwerken en regelgebaseerde systemen zijn hiervoor momenteel de bekendste technieken, maar ze hebben duidelijk hun beperkingen.
Bij spraakherkenning, misschien wel de bekendste toepassing van neurale netwerken, moet onderscheid gemaakt worden tussen klanken die veel op elkaar lijken, waardoor ‘herkenning’ (classificatie) niet met 100 procent zekerheid mogelijk is. Het herkennend vermogen van het netwerk wordt aangeleerd in een trainingsfase waarin het netwerk leerpatronen krijgt aangeboden. Het voorhanden zijn van deze leerpatronen legt een beperking op aan de toepassing van neurale netwerken. Zijn er onvoldoende geschikte leerpatronen beschikbaar, dan is het netwerk niet te trainen. Vanwege het blackbox-karakter van een neuraal netwerk is het bovendien onmogelijk om een classificatie te verklaren aan een gebruiker, anders dan met ‘het net zegt het’. Daarmee hangt weer samen dat het onmogelijk is om domeinkennis van een menselijke expert aan het kennismodel (het netwerk) toe te voegen. Een voorbeeld van kennis die niet uit data te verkrijgen is, luidt: hoe te handelen in zeldzame situaties. Indien een dergelijke situatie desastreuze gevolgen heeft, mag een kennissysteem die niet missen. Er zullen dan ook geen neurale netwerken gebruikt worden bij de bewaking en besturing van kerncentrales of de lancering van spaceshuttles.
Zekerheidsfactoren
Voor toepassingen waar expertkennis expliciet in het kennismodel moet worden opgenomen, zijn regelgebaseerde systemen bruikbaar. Deze systemen zijn oorspronkelijk bedoeld voor toepassing in deterministische domeinen. Omdat in realistische toepassingen de beschikbare domeinkennis vaak onzeker is, zijn er methoden ontwikkeld waarmee deze ongewisheid te representeren is in (bestaande) regelgebaseerde systemen.
Het bekendste voorbeeld van een regelgebaseerd systeem met ‘zekerheidsfactoren’, beter bekend onder de naam certainty factors, is Mycin. Dit is een regelgebaseerd systeem dat assisteert bij de diagnose en de behandeling van bacteriële infectieziekten. De praktische toepasbaarheid van zekerheidsfactoren is echter omstreden, vanwege grote problemen met de schaalbaarheid. In toepassingen met een realistische omvang is menig project gestrand in het eindeloos bijstellen van de factoren.
Met probabilistische netwerken is een techniek beschikbaar die de genoemde lacunes van neurale netwerken en regelgebaseerde systemen opvult. In een probabilistisch netwerk is de gerepresenteerde kennis gemakkelijk te interpreteren vanwege de intuïtief aantrekkelijke visualisatie hiervan in een netwerk. Tevens is de mate waarin de kennis invloed heeft op de beslissingen vast te leggen door gebruik te maken van kansen. De kracht van het gebruik van kansberekening als basis voor onzeker redeneren ligt enerzijds in het wiskundige fundament (hoe te rekenen met kansen staat vast) gecombineerd met de vertrouwdheid met het begrip kans. Deze vertrouwdheid is terug te vinden in het spraakgebruik: iets is 100 procent zeker, het is erop of eronder (fifty-fifty), er is een kleine kans op onweer, enzovoort. Het kansbegrip leidt niet tot problemen bij de interpretatie van de onzekerheid, zoals bij regelgebaseerde systemen en neurale netwerken het geval is.
Het netwerk vertoont zeer intuïtief redeneergedrag, doordat het van gevolg naar oorzaak èn van oorzaak naar gevolg kan redeneren. Voor mensen is dat heel natuurlijk, maar voor zowel neurale netwerken als regelgebaseerde systemen onmogelijk. Een probabilistisch netwerk voor bijvoorbeeld de beoordeling van een verzekeringsaanvraag kan door de vrijheid in redeneerrichting op grond van de gegevens van een aanvraagformulier bepalen wat het verwachte risico is. Ook kan het op grond van een bepaald ingegeven risico vaststellen wat het profiel is van een fictieve klant die daarmee overeenkomt.
Datamining en kennis-acquisitie
Het trainen van een neuraal netwerk is volledig data-gestuurd. Het opstellen van regels is volledig kennis-gestuurd. Bij de constructie van een probabilistisch netwerk zijn deze twee aanpakken te combineren. De domeinexpert assisteert bij het construeren van die delen van het model waarin zijn kennis (bijvoorbeeld over hoe te handelen in sporadisch voorkomende gevallen) gespecificeerd wordt. Datamining-technieken zijn aan te wenden bij de constructie van de overige delen van het model. De expliciete representatie van het model maakt een evaluatie door de domeinexpert mogelijk. Hierdoor zijn de resultaten van de datamining-technieken toetsbaar. De mogelijkheid om het model (of ontwerp) te evalueren is weliswaar een essentieel aspect voor elk systeem, maar voor een kennissysteem geldt dat nog sterker omdat de acceptatiedrempel voor kennissystemen (nog) hoog ligt.
Een ander belangrijk verschil en voordeel van probabilistische netwerken ten opzichte van neurale netwerken en regelgebaseerde systemen is modulariteit. Dit houdt in dat een netwerk eenvoudig aan te passen is aan wijzigingen en uitbreidingen in de kennis; schaalbaarheid is geen probleem. Hiertoe biedt de grafische representatie van het model een uitstekende en onmisbare ondersteuning van de communicatie tussen kennistechnoloog en domeinexpert. In zichzelf vormt het de uitleg voor de werking van het model.
Na de introductie van het probabilistische netwerk (Engels: Bayesian belief network) begin jaren tachtig is er de afgelopen jaren veel fundamenteel onderzoek verricht naar probabilistische netwerken. Dat betrof onder andere efficiënte algoritmes voor het redeneermechanisme van probabilistische netwerken en leeralgoritmes (datamining-technieken) die de constructie van de modellen kunnen ondersteunen. De resultaten van dit onderzoek hebben ertoe geleid dat er momenteel voldoende gereedschap is om praktische toepassingen in realistische domeinen mogelijk te maken.
Probleemdomeinen
In de probleemdomeinen waar probabilistische netwerken worden toegepast is een duidelijke trend van het academische naar het commerciële terrein te bespeuren. In chronologische volgorde zijn de volgende probleemdomeinen met een probabilistisch netwerk gemodelleerd.
Het oudste probabilistische netwerk, Munin, is een succesvolle tegenhanger van Mycin. Het Munin-netwerk assisteert bij de diagnose en behandelplanning van neurofysiologische aandoeningen. Munin telt enkele duizenden knopen. Het is ontwikkeld aan de universiteit van Aalborg in Denemarken. De drijfveren voor de ontwikkeling van Munin waren primair onderzoeksgericht. Vanwege de complexiteit is het medische domein zeer geschikt voor onderzoek aan de grenzen van de toepasbaarheid van beslissingsondersteunende systemen. Daarom ziet men vaak dat dit domein gekozen wordt voor experimenteer- en onderzoeksdoeleinden.
Inmiddels wordt Munin commercieel ingezet als trainingssysteem voor de geautomatiseerde ondersteuning bij de opleiding van aankomende neurofysiologen.
Een interessante ontwikkeling is de toepassing van probabilistische netwerken vanwege de tekortkomingen van regelgebaseerde systemen met zekerheidsfactoren. Gems (Generator Expert Monitoring System) kwam voort uit frustratie bij de pogingen om een regelgebaseerd systeem met zekerheidsfactoren te construeren. Daarna is de overstap gemaakt naar een probabilistisch netwerk. Gems wordt gebruikt bij het detecteren van mogelijke fouten in grote elektrische turbogeneratoren. Het bestaat uit een paar honderd knopen en is ontwikkeld aan het SRI International’s Management and Technology Center. De problemen bij de ontwikkeling van het regelgebaseerde systeem zijn te herleiden tot de eerder besproken beperkte schaalbaarheid van regelgebaseerde systemen. Het probleemdomein is technisch en laat zich goed modelleren dankzij de beschikbaarheid van uitgebreide documentatie over de werking en het ontwerp van de generatoren.
Een ander technisch domein waarin toepassingen van probabilistische netwerken te vinden zijn, is de ruimtevaart. Nasa maakt gebruik van probabilistische netwerken in het systeem Vista. Dit geeft advies over alternatieve oorzaken voor het falen van aandrijvingssystemen van de spaceshuttles. Ook hier geldt dat de werking en het ontwerp van de aandrijvingssystemen bekend zijn, waardoor het probleemdomein zich goed laat modelleren als een probabilistisch netwerk.
Trends
De toepassing van probabilistische netwerken in medische en technische probleemdomeinen is inmiddels succesvol te noemen en breidt zich steeds verder uit naar andere probleemdomeinen.
Probabilistische netwerken worden nu bijvoorbeeld ook toegepast in Windows 95. Wie de Answer wizards van Microsoft Office aanroept, gebruikt een probabilistische netwerk als onderliggend redeneermodel.
Momenteel zet de trend zich door richting bedrijfssystemen. In de financiële wereld zijn de netwerken toepasbaar bij het redeneren over marktmechanismes. Een probabilistisch netwerk kan bijvoorbeeld prijsvoorspellingen doen over bepaalde (productie)goederen, advies geven bij investeringsbeslissingen enzovoort. Verder valt te denken aan de toepassing van een probabilistisch netwerk bij de ondersteuning van managementbeslissingen. Ook kan het een manager assisteren bij het toewijzen van werknemers aan projecten waarbij prioriteiten, capaciteiten en projectprofielen enkele van de factoren zijn die deze beslissingen beïnvloeden.
De technologie van probabilistisch netwerken staat op het punt om door te dringen in het financiële domein. Bekende toepassingen in dit domein zijn momenteel nog niet talrijk. Overigens zal een bedrijf vanuit strategisch oogpunt niet staan te trappelen om succesvolle toepassingen van probabilistische netwerken wereldkundig te maken. We moeten dan ook niet meer wachten op succesverhalen over de toepassing van probabilistische netwerken in bedrijfssystemen, maar zelf het heft in handen nemen en deze toepassingen gaan ontwikkelen.
De toepassing van probabilistisch netwerken vergt naast een geschikte ontwikkelomgeving ook de nodige expertise op het gebied van kennisacquisitie, kennismodelleren in probabilistische netwerken, statistische (mining)methoden en kansberekening. Ontwikkelaars en leveranciers van softwarepakketten voor de ontwikkeling van probabilistische netwerken bieden dan ook tevens adviesdiensten aan op deze gebieden.
Zoals blijkt uit een recent overzicht van de softwaremarkt in het blad Software Release van maart dit jaar, bevinden de ontwikkelaars en leveranciers zich echter buiten Nederland, ondermeer in Denemarken en de VS.
Erica C. van de Stadt, research consultant
ID Research, Gouda