De hoeveelheid data die geproduceerd wordt blijft explosief groeien en lijkt niet te stuiten. Gartner voorspelt dat enterprise data de komende 5 jaar met 650 procent toeneemt. Inmiddels wordt de groei van data voor 80 procent veroorzaakt door ongestructureerde data. De groei van ongestructureerde data zal ook nog tien maal sneller groeien dan de groei van gestructureerde data.
Het maar uitbreiden van opslag- en rekencapaciteit levert onnodig hoge en ongewenste kosten op voor it-afdelingen. Daarnaast lost dit het probleem van de explosieve groei niet op. Ondertussen zijn er de nodige technieken ontwikkeld en geïntroduceerd om de datagroei in te perken, maar deze hebben maar een beperkt resultaat. Deduplicatie technieken perken de groei maar gedeeltelijk in en zijn eigenlijk alleen echt geschikt voor back-up doeleinden. Ongestructureerde data is namelijk over het algemeen vergelijkbaar, maar niet identiek, waar back-up data dat veelal wel is. Ook compressie levert maar een beperkt resultaat op, over het algemeen wordt de meeste data in hoeveelheid gehalveerd, maar bepaalde bestandstypen nemen nauwelijks minder ruimte in door deze te comprimeren, denk hierbij aan grafische bestanden. Daarnaast zorgt compressie en deduplicatie voor extra latency. Gecomprimeerde bestanden dienen namelijk weer uitgepakt te worden en gededupliceerde bestanden dienen weer opgebouwd te worden voordat deze aan de eindgebruiker gepresenteerd kunnen worden.
Door de ongestructureerde data zelf te optimaliseren kan wel het gewenste resultaat bereikt worden. Veel Microsoft Office-documenten nemen onnodig veel ruimte in beslag. Dat geldt overigens ook voor pdf-documenten, image files en dergelijke. Door deze bestandstypen te optimaliseren kan er aan de bron wel 50 tot 90 procent aan opslagcapaciteit bespaard worden. Bijkomend voordeel is dat bestanden hun oorspronkelijke bestandformaat behouden en dat de optimalisatie maar één maal plaats hoeft te vinden.
Doordat de bestanden zelf geoptimaliseerd worden, wordt naast primaire opslagcapaciteit ook opslagcapaciteit ten behoeve van uitwijk en backup en restore voorzieningen bespaard. Iedere gigabyte aan besparing op ongestructureerde data levert zo minimaal 3 gigabyte aan besparing op opslagcapaciteit op. Daarnaast werkt file-optimalisatie complementair naast traditionele optimalisatietechnieken als deduplicatie en compressie. Door file optimalisatie te combineren met compressie en deduplicatie kan een maximaal resultaat aan besparingen gerealiseerd worden.