Ingres Corporation betreedt met zijn databaseproduct VectorWise de markt van business intelligence en datawarehousing. Met behulp van vector processing kan deze database analysetaken razendsnel uitvoeren. VectorWise moet uitgroeien tot de tweede hoofdproductlijn naast de klassieke open source Ingres Database.
De klassieke database van Ingres is vooral bedoeld voor transactieverwerking. Het Amerikaanse bedrijf had nog geen goed product voor de groeiende BI- en datawarehousingmarkt. Ingres koos er voor om met VectorWise, een spin-off van het CWI (Centrum Wiskunde & Informatica), samen te werken om wel zo'n product op de markt te kunnen brengen. In juni 2010 verscheen alvast Ingres VectorWise 1.0 for Linux op de markt. Met de overname van de CWI-spin-off heeft Ingres definitief gekozen voor Vectorwise als tweede grote databaseproduct naast Ingres Database.
Nieuwe methode
De technologie van Vectorwise is volgens Peter Boncz, mede-oprichter van VectorWise en onderzoeker van CWI, een nieuwe benadering van de verwerking van gegevens die gebruik maakt van ‘vector processing' op datasets. Hierin is elke vector afgestemd op de grootte van het cachegeheugen van moderne processoren. Dit maakt het mogelijk om zowel SIMD (Single Instruction Multiple Data)-functies (zoals SSE's – Streaming SIMD Extensions – van Intel CPU's) als multi-core technologie te benutten, aangevuld met innovaties voor het optimaliseren van hoge-bandbreedte disk I /O.
Boncz stelt dat deze nieuwe methode de prestaties van bestaande databasetoepassingen verhoogt en data-analysetaken kan uitvoeren die voorheen niet haalbaar waren. Toepassingen zijn vooral bedoeld voor bedrijven en instellingen die afhankelijk zijn van de analyse van zeer grote hoeveelheden gegevens.
VectorWise
De technologie van VectorWise komt voort uit eerder CWI-onderzoek naar het open-source databasesysteem MonetDB. Naast financiële steun van Ingres zijn de onderzoeksactiviteiten voor Vectorwise (oorspronkelijk genaamd 'MonetDB/X100') ook ondersteund middels het onlangs afgeschafte BSIK-investeringsprogramma van het ministerie van Economische Zaken( de besteding van aardgasbaten om technologische innovatie te stimuleren).
Vector van getallen
Het onderzoek naar analytische databasetechnologie is sterk gericht op de relatie tot de moderne computers, licht Boncz toe. 'De voortdurend groeiende rekenkracht van hardware heeft gevolgen voor de organisatie van een databasesysteem. Als een database-query niet in het cachegeheugen past, draait hij zomaar tien keer langzamer. Data-analyseberekeningen die van SIMD-instructies gebruikmaken tellen in een stap een hele vector van getallen bij elkaar op, in plaats van slechts twee getallen. Een databasesysteem dat is ontworpen om van de mogelijkheden van moderne computers gebruik te maken, is veel krachtiger dan de producten die nu de markt domineren. '
Verstandig
Boncz wijst op het praktische probleem dat chips steeds sneller zijn geworden, maar dat de bestaande software hier niet goed mee uit de voeten kan. 'In bedrijfspresentaties die nieuwe computers aanprijzen wordt vaak nieuwe software gebruikt die wel kan omgaan met de snelste chips. Maar praktijk is dat de bestaande, veelgebruikte toepassingen zijn gebaseerd op programmacodes die jaren geleden zijn ontwikkeld.' Hij stelt dat met name databasesoftware complexe kernels kent die niet makkelijk te vervangen zijn. 'Voor een concern als Oracle is de database-kernel een van de pijlers van het imperium. Daarin ga je niet zomaar alles omgooien.'
De keuze van Ingres om een tweede innovatieve databaselijn, waarbij op een andere manier met data wordt omgegaan, op te bouwen vindt Boncz een moedige, maar verstandige besluit . 'Bij Ingres VectorWise zijn er componenten aan de onderkant van de database vervangen door gloednieuwe technologie. De bovenkant blijft wel de bekende Ingres-technologie.'
De ontwikkeling van VectorWise heeft een sterke impuls gegeven aan de wetenschappelijke innovatie op het gebied van databasetechnologie, ook buiten het CWI, beweert Boncz. Hij wijst er op dat wetenschappers uit de gehele wereld gebruikmaken van dit systeem als basis voor verder onderzoek. Het CWI werkt hieraan samen met Yale University, ETH Zürich, Ilmenau University of Technology, University of Tübingen, University of Edinburgh en het Barcelona Supercomputing Center. 'Er is een academische licentie voor VectorWise beschikbaar zodat wetenschappers onderzoek kunnen blijven doen naar de technologie achter deze database', vertelt Boncz. Opmerkelijk is dat VectorWise wel gedownload kan worden, maar dat er geen open source-gemeenschap van ontwikkelaars bestaat. Het technische werk blijft vooralsnog uitgevoerd worden door medewerkers van Ingres, met hulp van de academische wereld.
Ingres
In 2005 verkocht CA de meerderheid van de aandelen in zijn database-onderdeel Ingres aan de investeringsmaatschappij Garnett & Helfrich Capital. De poging van CA om het databasesysteem van Ingres onder een open source licentie als alternatief voor MySQL aan te bieden lukte niet goed. Als zelfstandig bedrijf is Ingres er wel ingeslaagd zichzelf sterk te positioneren als databaseleverancier. Het zegt wereldwijd zo'n tienduizend klanten te bedienen.
De Ingres-database is in de jaren zeventig ontwikkeld bij de Berkeley Universiteit van Californië. De relationele databasetechnologie is later de basis geweest voor verschillende commerciële databases, zoals Sybase, Microsoft SQL Server en PostgreSQL. Het bedrijf ASK Computer Group ontwikkelde een commerciële versie van de Ingres-database zelf, In 1994 werd dit bedrijf opgekocht door CA, die het als CA Ingres in de markt zette.
‘Bij Ingres VectorWise zijn er componenten aan de onderkant van de database vervangen door gloednieuwe technologie. De bovenkant blijft wel de bekende Ingres-technologie.’
Waarom zou een ander bedrijf zoals Oracle dat ook niet kunnen doen? MySQL heeft al verschillende engines onder de motorkap.