Yahoo zegt dat zijn index meer dan 20 miljard webdocumenten en afbeeldingen bevat. De zoekmachine deed eerder geen mededelingen over de omvang van zijn index. Yahoo stelt hiermee twee keer zo groot te zijn als concurrent Google.
De index van Yahoo is onder te verdelen in 19,2 miljard documenten en 1,6 miljard afbeeldingen. Google heeft niet meer dan 8,2 miljard webpagina’s en 2,1 miljard afbeeldingen. Microsoft’s MSN komt niet verder dan 5 miljard webpagina’s.
Volgens Danny Sullivan van Search Engine Watch zijn de beweringen over indexgrootte nagenoeg niet objectief te verifiëren. Bovendien vindt hij het aantal pagina’s belangrijk, maar niet zaligmakend. “Je zou een miljard pagina’s over Britney Spears toe kunnen voegen maar daarmee zal de kwaliteit van de zoekresultaten niet toenemen”, aldus Sullivan. Investeerders en adverteerders vinden de indexgrootte vaak wel belangrijk.
Yahoo stapte vorig jaar af van Google’s zoektechnologie. Het bedrijf combineert nu een reeks recent verkregen technologieën, zoals die van Inktomi en Overture. Yahoo heeft een crawler genaamd Slurp ingezet om webdocumenten te verzamelen voor het bouwen van een zoekindex. Slurp houdt ook kopieën van deze pagina’s bij, wat dus neerkomt op een Yahoo-cache.
Het wordt tijd dat iemand iets anders gaat doen dan Google. Het is nu Google wat de klok slaat. Niet meer objectief maar “het volgen van de grootste”. Innovatie is de weg.