"Het wordt tijd dat we in ons vak discussies voeren op basis van argumenten en kennis van concrete zaken, en niet langer in algemeenheden. Dan kunnen we gezamenlijk een eenvoudig, uitbreidbaar universeel datamodel in natuurlijke taal ontwikkelen", aldus Frank Twisk.
Terecht constateert ir A.S.H.P. van Renssen in zijn artikel Object-oriëntatie maakt plaats voor associatie-oriëntatie, Naar een universeel datamodel (Computable, 11 oktober 1996) dat ‘dingen’ (entiteiten, tabellen en thans objecten) op zichzelf staand geen betekenis hebben. ‘Dingen’ ontlenen hun betekenis en definitie aan zinnen of feiten, waarin die dingen ‘geassocieerd’ zijn. Zijn constatering dat ‘objecten’ niet toereikend zijn voor het analyseren en specificeren van kennis, bijvoorbeeld informatiesystemen, is volstrekt juist. Informatie kan uitsluitend begrepen en beschreven worden in natuurlijke taal. Dit blijkt al uit het feit dat Computable bestaat uit tekst en verwoordbare plaatjes. Objecten en entiteiten zijn implementatie-eenheden, die ongeschikt zijn voor communicatie of analyse.
Toch vond ik ook in dit artikel onderbouwing voor mijn algemene kritiek op veel publikaties in ons vakgebied (zoals in Automatiserings Gids, Informatie en Computable).
Auteurs leveren met onvoldoende kennis van zaken niet-onderbouwde, ‘algemene’ kritiek op theorie van anderen. Bestaande theorie laat men �f geheel links liggen �f zij wordt oppervlakkig bestudeerd. Suggestieve kritiek is risicoloos en kost weinig inspanning.
Auteurs bieden een schijnbaar betere, eigen oplossing aan. Dientengevolge ontbeert ons vakgebied nog steeds voldoende praktische, heldere en overdraagbare theorie en vaardigheden.
Om te voorkomen dat ook deze kritiek algemeen blijft, zal ik haar illustreren aan de hand van concrete voorbeelden uit eerder genoemd artikel.
Universele Informatiekunde
De auteur is mijns inziens onvoldoende op de hoogte van de door hem bekritiseerde methode van natuurlijke-taalanalyse van professor Nijssen en anderen. Dit blijkt uit de onderstaande opmerkingen.
Van Renssen refereert aan de informatie-analysemethode Niam. Deze mede door professor Nijssen uitgedragen theorie en vaardigheden op basis van taal wordt aangeduid als Universele Informatiekunde. UI omvat eenvoudige, eenduidige algoritmen voor analyse en implementatie van informatie, processen èn impulsen.
"Het is echter opvallend dat voor elk project weer een nieuw datamodel op basis van natuurlijke taal nodig lijkt te zijn", aldus de auteur. Dit is volstrekt onjuist. UI-modellen zijn makkelijk te integreren. Eerder geanalyseerde feiten kunnen eenvoudig hergebruikt worden. UI-modellen worden projectgewijs uitgebreid.
Een ander citaat: "Veel meer tijdwinst zou behaald worden als een formele versie van die ‘natuurlijke taal’ eens en voorgoed gedefinieerd wordt, waardoor een ‘universeel datamodel’ zou ontstaan". Universele Informatiekunde is reeds gedefinieerd door Nijssen [1] en Twisk [2]. Theorie is echter niet voldoende om een universeel data-model te doen ontstaan. Theorie moet ook in de praktijk gebracht worden!
Vervolgens wekt de auteur de suggestie dat natuurlijke-taalmethoden "zeer waarschijnlijk" wel geschikt zijn voor "maatwerk op een toepassingsgebied" maar ongeschikt voor "een bredere toepassing".
De onderbouwing van deze uitspraak ontbreekt volledig.
Tevens stelt Van Renssen dat ‘bottom-up’-methoden (wat dat ook moge zijn) leiden tot modellen die niet flexibel zijn. Natuurlijke-taalmodellen zijn eenvoudig uit te breiden met nieuwe feiten. De structuur van het ‘vorige’ natuurlijke-taalinformatiemodel blijft echter overeind, in tegenstelling tot bij IE, Yourdon en ooa/ood-modellen.
Type-niveau
De auteur schetst zelf een nieuwe ‘oplossing’, die aantoonbaar niet werkt. Het is weliswaar een aanpak op zin- of feittype-niveau en niet langer op entiteittype– of (object)klasse-niveau, maar opnieuw op type-niveau: analyse en communicatie in algemeenheden zonder concrete criteria.
Deze kritiek is ondermeer gebaseerd op de volgende kanttekeningen.
De opmerking dat de "dingen" weggelaten kunnen worden uit de zinnen of feiten om "generieke feiten" te construeren (p. 34) staat haaks op zijn eigen constatering dat ‘iets’ een associatie heeft met ‘iets’ (vijfde kolom, onderaan). Zinnen waarin de "dingen" weggelaten worden, zijn betekenisloos! [Limburg is een deel van Nederland] is een geheel andere ‘associatie’ dan [{1, 3} is een deel van {1, 3, 9}]. Het weglaten van de ‘dingen’ levert nietszeggende zinsdelen op, die later alsnog ‘bottom-up’ geanalyseerd moeten worden.
De door de auteur voorgestelde decompositie levert concreet niets op. Hij stelt (p. 35): "In het algemeen geldt dat een geheel kan worden verdeeld in een willekeurig aantal delen en dat een deel een deel kan zijn van een willekeurig aantal gehelen." De algemene [.. is een deel van ..]-constructie is uitstel van werk. Via een aparte associatie [.. kan een deel zijn van ..] geeft Van Renssen zelf al aan dat beperkingsregels een rol spelen in concrete situaties. De [.. is een deel van ..]-associatie kan na analyse in het ene geval in een oneindige boom resulteren en in het andere geval in een eindig netwerk.
Het classificatie-principe van Van Renssen stelt een metagrammaticale ‘oplossing’ (object-klasse en specifiek object) voor. Door het [is een]-probleem van concrete situaties te vermijden, wordt opnieuw werk uitgesteld. Herbruikbaarheid is slechts vast te stellen, nádat een specifieke [is een]-situatie is onderzocht. [Elmer is een man] en [Hans is een man] zijn voorbeelden van een geheel andere ‘associatie’ dan [Hans is een verdediger] en [Hans is een keeper].
Weliswaar is het artikel van Van Renssen slechts één voorbeeld uit een grote verzameling, maar concrete kritiek richt zich nu eenmaal op specifieke publikaties.
Mijn algemene kritiek betreft verscheidene publikaties binnen ons vakgebied. Veelal zijn die te kwalificeren als magie, kretologie, algemeenheden, (technologische) trends en ‘ieder zijn eigen aanpak’. Mede daarom zijn wij nog steeds onvoldoende in staat om op snelle èn effectieve wijze problemen begrijpelijk te beschrijven en te vertalen in oplossingen (bijvoorbeeld software of regelgeving). Het wordt tijd dat we in ons vak discussies voeren op basis van argumenten en kennis van concrete zaken, en niet langer in algemeenheden. Dan kunnen we gezamenlijk een eenvoudig, uitbreidbaar universeel datamodel in natuurlijke taal ontwikkelen.
Frank Twisk, ‘Informatiekundige adviezen en opleidingen’ te Castricum.
Literatuur:
[1] Nijssen, G.M.: Universele informatiekunde. Beutenaken (1993)
[2] Twisk, F.N.M.: Effectieve informatiesysteemontwikkeling. Kluwer (1994)