Ongestructureerde informatie is een belangrijke slokop van opslagruimte en de hoeveelheid ervan groeit jaarlijks nog met 40 procent. Opslag is duur en inspanningen om de groei af te remmen zijn dus welkom. De oplossing ligt volgens sommige leveranciers in het toevoegen van XML-metadata. Ze worden daarin bijgestaan door verschillende analisten, die initiatieven als het toekomstige Microsoft Office 12 wel zien zitten.
In een poging om naast het verminderen van opslagkosten ook de bedrijfswaarde van de groeiende berg ongestructureerde informatie te verhogen, is in mei Njini Software van start gegaan. Het bedrijf brengt een modulair systeem op de markt waarmee gegevens in een laag boven de opslagmedia kunnen worden voorzien van labels, uitgefilterd naar identieke duplicaten. Misschien is Njini wel op zoek naar een markt. Microsoft is immers volop bezig Office 12 te ontwikkelen, dat een breuk met het verleden zal betekenen. Het bestandsformaat wordt XML, dus tekst en veel kleiner dan de huidige binaire formaten. Microsoft beweert dat opslagkosten met het nieuwe Office-pakket dramatisch zullen verminderen omdat de bestanden veel kleiner worden. Njini ziet het ambitieuzer.
“Het onderkennen van de relevantie van gegevens op het punt dat ze ontstaan of de organisatie binnenkomen – en dus voor ze worden weggeschreven – is de enige manier waarop opslagkosten kunnen worden verminderd en de intrinsieke waarde ervan volop kan worden geëxploiteerd.” Aan het woord is Phil Tee, Chief Technology Officer en oprichter van Njini Software. Tee noemt zijn concept Information Asset Management (IAM), een begrip waarvan hij beweert dat de analisten het verkeerd hebben begrepen.
Een van die analisten is Sue Clarke van Butler Group. Zij is daar de expert op het gebied van Information Life Cycle Management. Zij vindt Njini op zich een goed product, maar gelooft niet dat het een doorbraak betekent. “Ik denk dat veel CMS-leveranciers precies hetzelfde kunnen leveren”, zegt ze. “Het is in geen geval een uniek product, zoals de oprichters schijnen te geloven. Om te slagen zal Njini er goed aan doen een OEM-partner te zoeken.”
Modules
In het concept van Njini moeten gegevens voorzien worden van een label met metadata voor ze worden opgeslagen, want alleen dan kunnen er meteen bewerkingen op worden losgelaten. Dat is wat njiniENGINE doet. Twee andere standaardmodules in het systeem zijn njiniENCOUNT en njiniENROLL. Zij zorgen respectievelijk voor het verwijderen van duplicaten en het wegschrijven naar een relevante opslaglocatie.
De labels die njiniENGINE aan gegevens koppelt zijn in het Njini-jargon ‘XML-tags’. Het zijn XML-gebaseerde metadata die iets zeggen over het bestand en zijn inhoud (die door njiniEngine wordt geanalyseerd). Aan de hand van die labels en vooraf gedefinieerde bedrijfsregels voor het bewaren en weggooien van informatie kan het systeem meteen na aanmaak of binnenkomst (e-mail) beslissingen nemen over het lot van een bestand.
njiniENCOUNT is de module die een analyse maakt van door njiniENGINE aangemaakte metadata en de bedrijfsregels over het bewaren van documenten, de levensduur van e-mailberichten, enzovoort. Het resultaat van die analyse bepaalt welke gegevens meteen mogen worden weggegooid omdat ze als identieke ‘dubbel’ bestaan in het systeem, en welke gegevens conform de bedrijfsregels moeten worden bijgehouden. Verder dient njiniENCOUNT ook als backup-module.
De laatste standaard meegeleverde module is njiniENROLL. Die maakt hiërarchisch opslagbeheer (Hierarchical Storage Management of HSM) mogelijk. Deze module slaat gegevens op verschillende media op, naargelang het belang ervan voor de organisatie. Kritische informatie wordt na beoordeling van de metadata en toetsing aan de bedrijfsregels weggeschreven naar een Tier 1 opslagmedium. Minder kritische gegevens worden naar Tier 2 en onbelangrijke informatie naar Tier 3 media of locaties weggeschreven. Wordt een Tier 2 of 3 document (dat kan ook een e-mailbericht zijn) echter belangrijker in de loop van zijn levenscyclus, dan kan njiniENROLL de gegevens verplaatsen naar de Tier 1 media of locatie.
Tee zegt dat Njini hiermee het traditionele door de mainframewereld gedicteerde patroon van traditioneel levenscyclusbeheer doorbreekt. De klassieke benadering wil immers dat informatie onbelangrijker wordt naarmate het veroudert. Het concept dat Njini volgt, gaat ervan uit dat oude informatie ooit nog belangrijk kan worden, en dat frisse informatie niet automatisch belangrijk is. Om het systeem af te ronden kunnen systeembeheerders het geheel aan hun behoeften aanpassen met een soort scriptingtaal.
Bedrijfsregels en XML-metadata
De reden voor het op de markt brengen is volgens Tee in de eerste plaats de kostenpost die ongebreidelde bewaring met zich meebrengt ten aanzien van hardware-investeringen. Ongestructureerde informatie bestaat vaak dubbel en de meeste bedrijven bewaren dubbele items uit angst iets per abuis weg te gooien. Om plaats te besparen moet dat toch, en dan komt Njini goed van pas. Njini kost zelf natuurlijk ook weer geld, en dus deed het bedrijf een kostenanalyse voor het Britse Telco waaruit moet blijken dat na vijf jaar tot 47 procent bespaard kan worden op opslaghardware. Die besparingen zijn inclusief de investering in Njini zelf.
Volgens de Njini-oprichter is zijn product uniek omdat het een combinatie maakt van bedrijfsregels (policies) en XML-metadata.
Butler bestrijdt dat idee. Sue Clarke: “Njini is op zoek naar een markt. Enterprise Content Management systemen doen ongeveer wat Njini doet. Alleen komen zij er pas tussen als de informatie al is weggeschreven.” Dat hoeft geen probleem te zijn, want een opslagreserve is sowieso noodzakelijk.
Office 12 en ECM
Precies hetzelfde soort metadata als Njini gebruikt, zal worden gebruikt om bestanden van Office 12 in weg te schrijven. Een bestand van Office 12 is een gezipt (gecomprimeerd) bestand waarin de documentstructuur in XML is beschreven. Dat heeft voordelen. Zo zullen Office-documenten ook geopend en bewerkt kunnen worden door niet-Office toepassingen. Het backoffice zal dankbaar gebruikmaken van de XML-structuur, omdat Office-documenten voortaan een container vormen van materiaal (tekst en multimedia) in een verpakte map. Voor externe toepassingen volstaat het analyseren van de XML-structuur van zo’n verpakking om met de inhoud te kunnen werken. Dat biedt mogelijkheden voor bijvoorbeeld inhoudbeheer (Enterprise Content Management). Zo kan zo’n systeem zonder verdere omzetting aan de slag met de Office-documenten. ECM-toepassingen leveren meestal erg krachtige metadatafunctionaliteit. Verder zit in een goed ECM-systeem standaard de mogelijkheid tot het verwijderen van duplicaten op basis van bedrijfsregels – ook voor e-mail. Met Office 12 alleen wordt dan misschien niet dezelfde functionaliteit verkregen als met Njini, maar het nieuwe bestandsformaat maakt wel krachtige en vergelijkbare toepassingen mogelijk in samenwerking met systemen die in de meeste grote organisaties al bestaan.
Wellicht het belangrijkste voordeel in relatie tot Njini is dat Office-bestanden gemiddeld tweederde tot de helft kleiner worden.
Omdat Microsoft ook een omzettingsprogramma zegt te leveren voor bedrijven die veel “pre-12” Office-documenten op opslagmedia hebben, mag verwacht worden dat wie overschakelt op Office 12 zijn opslagbehoefte sterk ziet afnemen. Een neveneffect wordt ongetwijfeld ook een kleinere behoefte aan bandbreedte. Njini werkt op geen van deze terreinen. Het programma gaat alleen aan de slag met het volume gegevens. Het doet dat wel voordat deze opgeslagen zullen worden, en het doet dat ook met e-mailberichten. Vooral dubbele berichten (een bericht dat van collega tot collega wordt ‘geforward’ heeft alleen meerwaarde als er inhoud aan wordt toegevoegd) kunnen door Njini gefilterd en uit het systeem verwijderd worden.
Voor zover nu bekend, is dat niet mogelijk met Office 12, hoewel het zoals eerder aangegeven wel makkelijk kan in combinatie met een CMS. Als het verkoopargument voor Njini beperkt blijft tot het verminderen van de opslagkosten, lijkt het er dus op dat het systeem een kort leven beschoren is. Sommige analisten worden echter lyrisch van de nieuwe starter. Nancy Hurley van Enterprise Strategy Group verwoordt het als volgt: “Het lijkt alsof Njini in een verzadigde markt opereert, maar de realiteit is dat Njini een totaal nieuwe generatie oplossingen vertegenwoordigt die Information Asset Management (IAM) leveren. Njini’s benadering van het probleem vermindert de behoefte aan redundante dataopslag en maakt het gebruik van huidige gegevens veel efficiënter.” Andere analisten, zoals Gartner, vinden het te vroeg om zich al uit te spreken over Njini.
Njini vs Storagetek & CMS
Sue Clarke van Butler Group maakte vorig jaar al gewag van oplossingen voor opslagbeheer – een ander soort product waar je volgens haar Njini mee kunt vergelijken – en besprak toen onder meer StorageTek. Dat was toen een van de eerste bedrijven met een oplossing voor het beantwoorden aan de strengere bewaarregels die gelden ten aanzien van bepaalde bedrijfsinformatie. Eén van de kritiekpunten die Clarke heeft op hardwaregestuurde oplossingen als die van StorageTek is dat ze snel aangroeiende informatie niet efficiënt kunnen beheren. Omdat de gegevens al zonder verdere ‘verrijking’ (met metadata) weggeschreven zijn als het beheer nog moet beginnen, kan StorageTek slechts aan deze kritiek tegemoetkomen door klanten een op bedrijfsregels gebaseerd systeem te verkopen dat de installatie van nieuwe hardware impliceert – net het omgekeerde van wat Njini beoogt.
Cms-systemen verrijken ongestructureerde informatie wel. Tenzij Njini met meer innovatieve modules op de markt komt, blijft dan als enige unieke eigenschap over dat het de problemen aanpakt voordat de gegevens weggeschreven worden. Volgens Sue Clarke is dat een erg dun verkoopargument.