Het gebruik van subjectieve kansverdelingen heeft zich reeds lang als succesvol bewezen, en heeft geen arbitrair karakter. De constructie van een probabilistische netwerk als combinatie van uit data geleerde kennis en expertkennis is een zeker proces." Erica C. van de Stadt reageert op W.J. Jansen.
In mijn artikel positioneer ik probabilistische netwerken als een techniek voor kennisrepresentatie en kennismanipulatie (ook wel redeneren genoemd). Bij het ontwerp van deze netwerken zijn datamining-technieken en kennismodelleer-technieken te integreren.
Om misverstanden uit de weg te ruimen zet ik een aantal onderscheidende aspecten van neurale netwerken en probabilistische netwerken naast elkaar.
Een van de belangrijkste kenmerken waaraan de resultaten van datamining-technieken moeten voldoen, is het opleveren van een (intuïtieve) interpretatie van de ontdekte wetmatigheden.
Bij probabilistische netwerken wordt dit eenvoudig gerealiseerd, doordat deze slechts interpreteerbare concepten bevatten. Bij neurale netwerken zijn – voor zover dit al mogelijk is – complexe extra analyse- en ontwerptools benodigd om in de wirwar van knopen nog betekenisvolle elementen te onderscheiden.
Als onderdeel van de datamining-techniek met probabilistische netwerken worden beproefde statistische methoden gebruikt; er is dus geen sprake van ‘arbitrair gestelde kansdichtheden’, zoals de heer Jansen opmerkt. Hier komt nog bij dat Bayesiaanse leermethoden zodanig zelfregulerend zijn dat ‘data-overfitting’, een bekend probleem bij neurale netwerken, voorkomen wordt
Bij het ontwerp van probabilistische netwerken gebruikt men voor het kwantificeren van heuristische expertkennis zogenaamde subjectieve kansverdelingen. Het gebruik van subjectieve kansverdelingen heeft zich reeds lang als succesvol bewezen, en heeft geen arbitrair karakter. Kortom, de constructie van een probabilistische netwerk als combinatie van uit data geleerde kennis en expertkennis is een zeker proces.
Classificatie
De oorspronkelijke charme van neurale netwerken is hun toepassingskracht in classificatietaken waarvoor geen a priori kennis (zoals bijvoorbeeld fysische modellen) beschikbaar is. Zodra we echter kennis uit andere bronnen dan meetdata aan een neuraal netwerk willen toevoegen, is ook hier een ontwerpproces noodzakelijk. Daarmee gaat de oorspronkelijke eenvoud (louter trainen) verloren.
De ondersteuning van het ontwerpproces voor neurale netwerken is nog volop in ontwikkeling maar reikt voorlopig niet verder dan ‘ad hoc’ methoden waarin slechts ervaren ontwerpers met complexe cad-tools netwerken zinvol kunnen modelleren.
Signaleert een operationeel neuraal netwerk bijvoorbeeld een uitzonderingssituatie door middel van ‘condition monitoring’, dan kan de input die dit signaal veroorzaakt natuurlijk elders worden afgehandeld. Het is evident dat aan dit redigeren van inputverwerking een ontwerp ten grondslag moet liggen. Dit ontwerp staat echter los van de gebruikte neurale-netwerktechniek en vereist telkens specifieke extra kennis en technieken om tot een oplossing hiervoor te komen.
Een uitbreiding van een probabilistisch netwerk met expertkennis over bijvoorbeeld uitzonderingssituaties blijft binnen één en hetzelfde raamwerk: het probabilistisch-netwerkparadigma beschikt hiertoe over voldoende uitdrukkingskracht en uitbreidingsfaciliteiten.
Neurale netwerken zijn een krachtige techniek voor een aantal complexe classifcatietaken. De tekortkomingen van neurale netwerken, zoals in mijn artikel genoemd, zijn echter nog steeds actueel en worden – zeker voor een deel – opgevangen door probabilistische netwerken. Binnen andere toepassingsgebieden waar interactief, gecombineerd diagnostisch en prognostisch redeneren en beslissen een belangrijke rol spelen, bieden probabilistische netwerken helaas vooralsnog het enige alternatief.
Erica C. van de Stadt, research consultant ID Research, Gouda