BLOG – Het traditionele toetsenbord is een vertrouwde vriend voor de kantoorwerker. Maar dat gaat veranderen nu spraakcommando’s voor ai de norm worden.
Ai-gestuurde spraaktechnologie kan tegenwoordig menselijke spraak ook met een bijna menselijke precisie begrijpen. En dat verandert de manier waarop we met onze apparaten omgaan volledig. In diverse sectoren, van kantoorwerk tot entertainment en consumententechnologie, vervangen spraakcommando’s langzaam maar zeker toetsenborden. De overgang van tekstgebaseerde interacties naar spraakgestuurde commando’s is niet alleen handig, maar een ware revolutie op het gebied van productiviteit en technologie.
Gebruikers kwamen er snel achter dat deze ‘slimme’ assistenten nog niet zo slim waren
Het verandert hoe mensen werken, communiceren en omgaan met de wereld om hen heen. Het moment om je stem te laten horen, is aangebroken, want de toekomst van werk draait om spraak. Hoe gaat dat eruitzien en waarom zien we deze ontwikkeling juist nu?
Logische keuze
Uit onderzoek blijkt dat spraak tot wel vier keer sneller kan zijn dan typen, waardoor gebruik van spraaktechnologie in zowel persoonlijke als professionele omgevingen een logische keuze is vanuit een efficiëntieperspectief.
Met spraakgestuurde ai kunnen gebruikers systemen bedienen, data analyseren en taken automatiseren simpelweg door te spreken. Dit vereenvoudigt workflows en helpt werknemers efficiënter te werken, vooral in situaties waarin handsfree werken of tijdsdruk een rol speelt. Geen getyp meer, maar natuurlijke gesprekken met ai-systemen die in realtime kunnen luisteren, begrijpen en reageren.
Spraakassistenten zoals Siri, Alexa en Google Assistant riepen bij hun opkomst veel enthousiasme op. Toch bleven ze vaak achter bij de verwachtingen. Ze konden de weersvoorspelling geven of het nieuwste nummer van Taylor Swift afspelen, maar uiteindelijk bleken de toepassingen te beperkt. Gebruikers kwamen er snel achter dat deze ‘slimme’ assistenten nog niet zo slim waren. Bovendien hadden ze vaak moeite met het begrijpen van accenten, het interpreteren van context en het omgaan met complexe taken, wat regelmatig tot frustratie leidde. De grote verandering die we nu zien, is dat ai-systemen verder kunnen gaan omdat ze slimmer worden en eindelijk toegang hebben tot contextuele gegevens, zoals werkgerelateerde data.
Recente ontwikkelingen, met name de opkomst van generatieve ai zoals OpenAi’s ChatGPT of Googles Gemini, hebben alles veranderd. Hoewel we op veel gebieden nog ver verwijderd zijn van menselijke intelligentie, zijn de nieuwste modellen al veel slimmer dan hun voorgangers, zoals spraakassistenten. Gebruikers merkten dit meteen op: ChatGPT bereikte honderd miljoen gebruikers in slechts twee maanden, waarmee het TikTok met zeven maanden overtrof en een nieuw record vestigde voor adoptie. Deze opmars zal onze manier van werken met computers en interactie met technologie volledig veranderen.
Doorbraak
Hoewel spraakherkenningstechnologie al ver ontwikkeld was, was generatieve ai nodig om een echte doorbraak te bereiken in spraakgestuurde ai. Stel je bijvoorbeeld voor dat je een e-mail opstelt met je stem. Zonder generatieve ai zou dit moeizaam gaan, omdat gesproken taal vaak minder gestructureerd en minder beknopt is dan geschreven tekst. Dit is waar generatieve ai echt uitblinkt: deze modellen begrijpen je intentie uitstekend. Je kunt minutenlang praten, en het model weet de essentie van wat je bedoelt helder samen te vatten. Maar het gaat verder dan dat: het kan ook direct actie ondernemen.
Met tools zoals ChatGPT en CoPilot kun je nu al e-mails beantwoorden, vergaderingen samenvatten, PowerPoint-presentaties maken, computercode schrijven en nog veel meer. En al deze taken kun je sneller uitvoeren met je stem. Dankzij de combinatie van deze technologieën is er vrijwel geen taak meer waarvoor het intikken van de opdracht sneller is dan een spraakcommando.
Naarmate ai zich verder ontwikkelt, wordt een spraakgestuurde toekomst van werk meer werkelijkheid. De effectiviteit hiervan hangt sterk af van geluidskwaliteit, aangezien ruis nog altijd een van de grootste uitdagingen blijft voor spraakgestuurde systemen. In een rumoerige omgeving begrijpen deze systemen je simpelweg niet.
Namens Jabra hebben we onlangs extern onderzoek laten uitvoeren naar de transcriptienauwkeurigheid (het percentage woorden dat correct wordt begrepen door ai) in lawaaierige omgevingen. Dit onderzoek liet een groot verschil zien tussen consumententoestellen, die veelal naar kantoor worden meegenomen, en professionele apparatuur. Terwijl consumententoestellen slechts een nauwkeurigheid van 55 procent behalen, waardoor ai-agents vaak niet begrijpen wat je zegt, heeft professionele technologie een nauwkeurigheid van 95 procent. Dit laat de essentie van professionele apparatuur zien, zeker wanneer spraakcommando’s nauwkeurig moeten worden opgepakt voor een optimale samenwerking op de werkvloer.
Sleutel
De toekomst van productiviteit ligt in generatieve ai, en de sleutel tot het succesvol omarmen hiervan is een sterke implementatie van spraaktechnologie. Hoewel sommigen zich zorgen maken dat ai de kenniswerker zal vervangen, kunnen we beter zeggen dat ‘je niet door ai wordt vervangen, maar door een mens die ai gebruikt.’ We kunnen hieraan toevoegen: ‘Je wordt vervangen door een mens met een spraakinterface naar ai’ omdat deze mensen sneller zullen werken dan degenen die afhankelijk zijn van toetsenborden en getypte tekst.
Het tijdperk van het toetsenbord verdwijnt naar de achtergrond. Maar zijn bedrijven klaar om de kracht van spraak te benutten? Het kan resulteren in nieuwe slagen op het gebied van efficiëntie, flexibiliteit en innovatie. En dat kan je op termijn een concurrentievoordeel opleveren in een steeds meer gedigitaliseerde wereld.
Wie voorop wil blijven lopen en wil profiteren van ai, doet er goed aan om de mogelijkheden van spraak te ontdekken. Spraakgestuurde ai biedt kansen voor productiviteit en samenwerking. Tijd om je stem te laten horen.
Marvin Korthout is Benelux sales director bij Jabra
![](https://www.computable.nl/wp-content/uploads/2025/02/Jabra_Marvin-Korthout-4x3-1.jpg)
Spraakgestuurd werken zal meer en meer komen. Is ook goed tegen RSI, ook al begrijpen ai-agents vaak niet wat je zegt (vaak ook niet als je wat typt). Met professionele apparatuur is een nauwkeurigheid van slechts 95 procent te bereiken, al dat zal beter worden.
De vraag is, krijgt iedereen z’n eigen hok of stiltecoupé? Want gezamenlijk werken met computers, is wat anders dan gezellig door elkaar kletsen, waar het non-verbale belangrijker is dan de exacte verbale inhoudelijkheid.