Met de lancering van Gemini, het grootste en meest ingenieuze artificiële intelligentie (ai)-taalmodel van Google, doet het techbedrijf een aanval op de leidende positie van OpenAI’s GPT-4. Volgens ai-experts is het verschil tussen beide grote taalmodellen (LLM) gering. Naar de meeste vergelijkingsmaatstaven zijn Gemini en GPT-4 zeer gewaagd aan elkaar.
Google-moeder Alphabet presenteerde woensdag een groot aantal benchmarks waaruit een voorsprong zou blijken. Maar volgens ai-watcher Gary Marcus is Google er niet in geslaagd het door Microsoft gefinancierde OpenAI duidelijk op achterstand te zetten. Wel staat vast dat OpenAI een serieuze concurrent heeft gekregen die commercieel potten kan breken. Bedrijven zijn niet meer aangewezen op de technologie van OpenAI. De strijd tussen Google en Microsoft komt hiermee in een stroomversnelling.
Het was er Alphabet veel aangelegen om weer langszij te komen. Volgens topman Sundar Pichai is het nieuwe ai-model qua wetenschap en techniek een van de grootste projecten die zijn bedrijf ooit heeft gedaan. Gemini 1.0 is een nieuw hoofdstuk in een ontwikkeling die acht jaar geleden begon. Van de eerste versie van dit taalmodel komen drie versies beschikbaar. Voor zeer complexe taken brengt Google de grootste en best presterende versie uit onder de naam Gemini Ultra. Die versie moet draaien in een datacenter.
Gemini Pro
Bedrijven kunnen ook kiezen voor Gemini Pro, een versie die minder computerkracht vergt en toch geschikt is voor een brede reeks taken. Het meest efficiënte model dat op een smartphone of ander mobiel apparaat past, heet Gemini Nano. Gemini presteert niet alleen beter dan de ‘oude technologie’, maar legt ook minder beslag op server-capaciteit.
Volgens Google is Ultra het eerste grote taalmodel dat beter dan menselijke experts presteert als het gaat om het uitvoeren van meerdere taken waarbij begrip van taal om de hoek komt kijken. Het model kon kennisvragen beter beantwoorden en problemen om 90 procent van de gevallen beter oplossen als het gaat om een combinatie van 57 vakgebieden zoals wiskunde, natuurkunde, geschiedenis, rechten, medicijnen en ethiek. Gemini 1.0 is van grond af aan multimodaal opgezet. Het ai-model kan overweg met tekst, beeld, audio en programmeercode. Gemini kan scherpzinniger redeneren en ook veel sneller zaken doorgronden dan Google’s vorige technologie.
Google stopt meteen al een deel van zijn nieuwe technologie in de ai-assistent Bard. De chatbot kan niet alleen vragen beantwoorden maar ook bijvoorbeeld puzzels oplossen en samenvattingen van teksten maken. De aangepaste versie van Gemini Pro in Bard werkt voorlopig alleen in het Engels. Begin volgend jaar komt ook de meest geavanceerde versie van Gemini terecht in Bard. Meer details in het blog van Google.