Snowflake lanceert Arctic naar eigen zeggen het meest open, enterprise-grade large language model (llm) op de markt. Het is een van de eerste wapenfeiten van Sridhar Ramaswamy, de nieuwe ceo van Snowflake die een maand geleden de fakkel overnam van Frank Slootman. Slootman leidde het datacloudbedrijf sinds 2019.
Ramaswamy is sinds vorig jaar bij Snowflake aan de slag. Hij kwam er terecht na de overname van Neeva, een bedrijf dat een door ai aangedreven zoekmachine biedt. Het stond dus in de sterren geschreven dat Snowflake nog meer de kaart van ai zou trekken, al blijft data vooropstaan. ‘Goede data is en blijft de olie voor ai’, zo vertelde de topman tijdens de persconferentie waarbij hij ook Snowflake Arctic aankondigde.
Het nieuwe taalmodel is een onderdeel van de Snowflake Arctic-modelfamilie, een familie van modellen die ook het praktische tekst-invoegmodel bevatten. ‘Met Snowflake als datafundament voor meer dan 9.400 bedrijven en organisaties over de hele wereld, stellen we alle gebruikers in staat om hun data te benutten met toonaangevende open llm’s. Terwijl het hen flexibiliteit en keuze biedt met welke modellen ze werken.’
Overtreft
Arctic is ontworpen om het meest open enterprise-grade llm in de markt te zijn. Het is geoptimaliseerd voor complexe enterprise-workloads en volgens de makers overtreft het verschillende industrie-benchmarks zoals op het gebied van SQL-codegeneratie en het volgen van instructies. ‘Dankzij zijn mixture-of-experts-architectuur levert Arctic top-tier-intelligentie met ongeëvenaarde efficiëntie op schaal’, klinkt het.
Naast de zogenaamde enterprise intelligence wordt met name de openheid in de verf gezet. Zo geeft Snowflake de Arctic-weights vrij onder een Apache 2.0-licentie én de details van het onderzoek dat heeft geleid tot hoe het model is getraind. ‘Hiermee wordt een nieuwe standaard op het gebied van openheid voor enterprise-ai-technologie gezet’, stelt Ramaswamy. ‘We verleggen de grenzen van wat opensource-ai kan doen.’
Naast het Arctic-llm omvat de Snowflake Arctic-familie ook de onlangs aangekondigde Arctic-embed, een familie van state-of-the-art-tekst-inbeddingsmodellen die beschikbaar is voor de opensourcecommunity onder een Apache 2.0 licentie. Net als recente toevoegingen van Reka en Mistral AI’s-modellen.
Opensource in ai lijkt ingeburgerd te raken. Zo haalt Snowflake een recent rapport van Forrester aan. Daarin geeft 46 procent van de wereldwijde ai-beslissers in bedrijven aan dat ze gebruikmaken van bestaande opensource-llm’s. En dit om generatieve ai te gebruiken als onderdeel van de ai-strategie van hun organisatie.