De Technische Universiteit van Madrid (UPM) werkt al een paar jaar aan een database waarmee programmeurs regels code kunnen terugvinden in open source software. De database rangschikt code op functie en haalt zoekresultaten uit de broncode van verschillende toepassingen. Een proefversie staat nu op het web.
Volgens Manuel Carro, een van de auteurs van de database, onder meer mogelijk om uit de combinatie van verschillende pakketten nieuwe programma’s te vervaardigen. Zoeken in een internetzoekmachine als Google is niet hetzelfde, stellen de makers. Een dergelijke zoekmachine kan geen onderscheid maken tussen synoniemen zoals die in de ict gebruikelijk zijn. Zoeken vereist in dat geval voorkennis over de te zoeken software, of levert veel verkeerde resultaten.
Jdbc
Een zoekopdracht zou bijvoorbeeld een programma voor het doorsturen van mail kunnen betreffen. De opdracht is dan in(smtp), out(smtp), en de database presenteert dan alle mailservers die dat kunnen (zoals Sendmail, Exim, Postfix). Zoekopdracht ou(sql-server) levert als mogelijk resultaat de Apache James mailserver en alle databases die met Suns Java database connector (Jdbc) overweg kunnen. Een ander voorbeeld van de samensteller is het zoeken naar een compiler voor de programmeertaal Fortran95. De database levert bijvoorbeeld de SGI pro64, die als beschrijving heeft: in(f95), in(C), in(C++), out(binary-code-IA64).
Een prototype van de database is te vinden op http://www.clip.dia.fi.upm.es/~amos/AMOS/. Hier kan worden gekozen uit ruim honderd elementen, voornamelijk software geschreven voor websites. “Dat is niet veel, maar het laat wel goed zien wat het systeem kan doen”, aldus Carro. De database kan volgens de onderzoekers ook worden ingezet op andere terreinen, zoals voor het doorzoeken van wetenschappelijke publicaties of rechterlijke uitspraken. “Overal waar een hoop informatie gerangschikt, geclassificeerd en gecatalogiseerd moet worden.”< BR>