De ‘digital object identifier’ is een onveranderlijk identificatienummer voor digitale inhoud. De doi moet onder meer die inhoud toegankelijk houden, ook als de locatie op internet verandert. Een doi is aanklikbaar in een applicatie die dit ondersteunt en gekoppeld aan gestandaardiseerde metadata.
Eeuwig De enige voorwaarde waaraan een ‘digital object identifier’ moet voldoen is dat hij uniek en duurzaam is. Een doi kan naar alles verwijzen: een abstract werk, een uitvoering of registratie in een bepaald formaat, een geheel als een tijdschrifteditie of een deel als een artikel in dat blad enzovoort. Een doi mag nooit naar twee zaken verwijzen. Zodra een entiteit een doi heeft gekregen kan dat identificatienummer niet worden hergebruikt, ook niet als het werk inmiddels van internet is verwijderd. Nieuwe soortgelijke uitvoeringen of versies krijgen desgewenst een nieuw doi. Een doi bestaat uit een voor- en een achtervoegsel, beide van willekeurige lengte, gescheiden door een ‘/’. Het formaat is gebaseerd op de Ansi/Niso Z39.84-2000-standaard. In een doi wordt geen onderscheid gemaakt tussen kleine en hoofdletters. 10.2345/S1384107697000225 10.4567/0361-9230(1997)42: 10.6789/JoesPaper56 De eerste ’10’ identificeert de codes als doi’s. Het gedeelte tussen ‘.’ en ‘/’ is een registratienummer dat onder verantwoordelijkheid van de IDF (International Doi Foundation) door een registratieagentschap wordt toegekend. Crossref is zo’n agentschap. Het heeft bijvoorbeeld doi-prefixen gegeven aan de Ieee (10.1109), Academic Press (10.1006) en Kluwer (10.1023). De houders van zo’n prefix kunnen voor het gedeelte na ‘/’ elk identificatieschema gebruiken dat zij willen. Ze zijn ook volledig verantwoordelijk voor de uniekheid en duurzaamheid van hun doi-suffix. Dat lijkt problemen te kunnen geven, maar doi’s worden als indirecte url-verwijzing op internet geadministreerd en duplicaties zijn dus gemakkelijk te weren. De mogelijkheid om bestaande identificatieschema’s te gebruiken in een doi (als suffix) is een groot voordeel. Niet alleen officiële nummeringen als isbn en issn (boeken en tijdschriften), maar ook allerlei interne administratiesystemen met willekeurige betekenissen zijn met een geregistreerd prefix tot doi om te vormen. Dergelijke geïmpliceerde betekenissen, zoals hierboven ‘JoesPaper56’ en ‘(1997)’, hebben echter geen externe betekenis. Een doi is een ‘dom nummer’, waardoor hij hetzelfde kan blijven als een entiteit verplaatst of verhandeld wordt. Stel dat de Ieee het tijdschrift Nature overneemt, dan houdt het artikel ‘Cell Biology: A cat cloned by nuclear transplantation’ (Nature AOP, 14 februari 2002 online gepubliceerd) de doi 10.1038/nature723. 10.1038 verandert dus niet in de 10.1109 van de Ieee, ook al is het artikel waarschijnlijk naar een Ieee-site verplaatst en is de url overeenkomstig bijgewerkt. Alle bestaande doi-verwijzingen, zowel in druk als op internet, blijven onveranderd geldig. |
Hiermee heeft de International Doi Foundation (IDF) zijn eerste doel bereikt: een unieke en duurzame identificator die op een netwerk te activeren is. Een doi verwijst naar een inhoud en niet naar een adres, en geeft op het moment van gebruik de dan geldige locatie.
Zonder catalogus
Internet is wel eens getypeerd als een ‘gigantische bibliotheek zonder catalogus’. De in 1998 opgerichte IDF probeert een basis voor zo’n catalogus te leggen. Ontkoppeling van digitale inhoud en locatie ondersteunt ook de exploitatie van intellectueel eigendom en het bijbehorende beheer van rechten (drm, digital rights management). Als digitale tekst, audio, video of welk auteursrechtelijk beschermd werk dan ook in andere handen overgaat en dus door een nieuwe eigenaar wordt beheerd, verandert de doi niet mee.
Vooral de uitgeefwereld is dan ook sterk vertegenwoordigd in de IDF. Naast onder andere Elsevier, Springer Verlag, de Association of American Publishers en de Nederlandse Koninklijke Bibliotheek zijn ook de ACM, Microsoft en Hewlett-Packard lid van de stichting.
Ondersteuning van een doi-systeem bestaat uit vier componenten: de doi zelf als betekenisloos ofwel ‘dom’ identificatienummer, een beschrijving van de entiteit waar de doi naar verwijst (metadata), een netwerktechnologie om de doi te activeren tot levering van iets (aan de client) en een beleid om het systeem in de praktijk te laten werken.
Handvatten
De doi-technologie is niet van de grond af aan opgebouwd, maar vormt een implementatie van het ‘handvatsysteem’ (handle system) dat door de Amerikaanse Cnri (Corporation for National Research Initiatives) is ontwikkeld. De principes zijn al in 1995 beschreven door internetpioniers Kahn en Wilensky in hun artikel ‘A Framework for Distributed Digital Object Services’. Dat raamwerk maakt het mogelijk om op computernetwerken, met name het wereldwijde internet, naar inhoud in plaats van adressen te verwijzen. Een stuk digitale inhoud ofwel object krijgt daartoe een duurzaam handvat toegewezen dat door een ‘handvatsysteemserver’ (handle system server) gebruikt kan worden om de client een adres of url te retourneren.
De relatie tussen handvat en locatie moet dan worden bijgehouden. Dat doen de ‘lokale handvatdiensten’ (local handle services) onder verantwoordelijkheid van een ‘wereldwijde handvatregistratie’ (global handle registry). Handvatten volgen dezelfde syntax als doi’s. Het voorvoegsel wordt centraal toegewezen en kan dan zonder omwegen naar de juiste lokale handvatserver verwijzen. Een handvatsysteem is dus in zekere zin een dns (domain name service) met een extra indirecte stap.
In tegenstelling tot een dns is een handvatsysteem echter niet universeel geïmplementeerd op internet. Wel onderhoudt het Cnri een publieke handvatdienst en heeft het een Java-versie van een lokale handvatserver vrij beschikbaar gesteld. Voor Windows-clients is er een handvatsysteem ‘resolver’ die als webbrowser plug-in handvatten kan verwerken. Ook voor Adobe Acrobat en Acrobat Reader is zo’n plug-in beschikbaar.
Een doi is, als implementatie van een handvat, met deze hulpmiddelen ook direct aanklikbaar. In een standaard webbrowser zijn doi’s eveneens aanklikbaar, maar dan moeten zij deel uitmaken van een url met de op dit moment in gebruik zijnde proxyserver dx.doi.org. Voor de tienmiljoenste doi wordt dat dus: http://dx.doi.org/10.1007/s00348-003-0647-4.
Het artikel van Kahn en Wilensky heeft geen doi maar wel een handvat die op hdl.handle.net wordt beheerd. Aanklikken van hdl.handle.net/4263537/5001 (in een gewone browser zonder plug-in) produceert een Html-pagina die toen dit artikel geschreven werd de url http://www.cnri.reston.va.us/cstr/arch/k-w.html had, maar die nu best ergens anders kan staan.
Standaarden
Een duurzaam identificatienummer maakt het mogelijk om standaard gegevens aan digitale inhoud te koppelen. Deze metadata geven doi’s toegevoegde waarde en vormen de basis voor een catalogus of, vanuit een ander gezichtspunt, een barcode voor internet.
De IDF gebruikt hiervoor het indecs-raamwerk (interoperability of data in e-commerce systems) met een ‘datadictionary’ die ook door mpeg-21 (moving pictures expert group) is overgenomen. Er zijn nogal wat van dergelijke standaarden in omloop, zoals dcmi (dublin core metadata initiative) en onix (online information exchange). De IDF heeft diverse afbeeldingen geconstrueerd tussen sectorspecifieke formaten en indecs.
Ieder digitaal object met een doi heeft in ieder geval een metadatakern die onder andere een titel, een type (abstract werk, uitvoering et cetera), een mode (visueel, audio, audiovisueel enzovoort) en een primaire agent (zoals auteur of componist) specificeert. Naast deze voor elke doi verplichte metadata kan een digitale inhoud ook een of meerdere applicatieprofielen meekrijgen. Een doi-registratieagentschap voor spellen bijvoorbeeld kan op mobiele telefoons een ander applicatieprofiel gebruiken dan Crossref, dat zich met wetenschappelijke tijdschriften, boeken en congresverslagen bezighoudt.
Rechtenbeleid
Crossref is op dit moment verreweg de grootste doi-beheerder. Uitgevers deponeren tegelijkertijd met een doi bibliografische metadata (volgens een XML-schema) die onderhouden wordt in een mddb (metadata database). Die mddb kan door middel van zoekopdrachten ook doi’s vinden van literatuurverwijzingen in artikelen (catalogusfunctie). Crossref wordt beheerd door de in 2000 opgerichte Publishers International Linking Association.
De vierde component van het doi-systeem is het beleid. De administratie van doi’s en metadata wordt bijgehouden door registratieagentschappen. De IDF wijst centraal blokken identificatienummers toe (de doi-voorvoegsels) en bepaalt de algemene voorwaarden voor het gebruik. De IDF houdt zich bovendien bezig met de verdere ontwikkeling van het doi-systeem. De volgende stap wordt waarschijnlijk de integratie van doi-indentificatie, handvatten en metadata met Openurl contextafhankelijk linken. Met Openurl kan het resultaat van een doi-klik afhankelijk worden van de betreffende aanvrager en diens rechten voor toegang tot de content. Dit is niet alleen interessant voor institutionele gebruikers, zoals bibliotheken en grote ondernemingen, maar ook voor het beheer van digitale intellectuele eigendomsrechten in het algemeen. < BR>
http://www.doi.org
http://www.handle.net
http://www.indecs.org
http://www.crossref.org
http://www.ukoln.ac.uk/distributed-systems/openurl/