Praten is onze meest natuurlijke communicatiemiddel. Gesprekken zijn persoonlijk en bieden contextuele elementen die het wederzijds begrip van de gesprekspartners vergemakkelijken. Deze uitwisselingen blijven zich ontwikkelen en de context ervan ondergaat nog altijd een verrijking. Het vermogen van technologie om een menselijk gesprek aan te gaan, geldt dan ook als een uitdaging.
De interfaces van onze digitale hulpmiddelen zijn altijd bepaald door de mogelijkheden van onze computersystemen: toetsenborden, muizen, grafische interfaces, afstandsbedieningen en touchscreens. De mogelijkheid om digitale hulpmiddelen aan te raken, heeft handelingen eenvoudiger gemaakt: je hoeft alleen maar een scherm aan te tikken om de gewenste applicatie te onthullen. Maar wat als dit niet goed werkt?
Er is een groot aanbod van toepassingen met elk een andere manier van besturing. Het kost soms veel tijd om er achter te komen hoe een toepassing werkt en hoe je de juiste informatie kan verkrijgen. Applicaties bieden niet altijd een vloeiende, klantgerichte ervaring die onze digitale systemen integreert in onze ‘analoge’ levens. Middels spraak kan je als gebruiker gemakkelijk aangeven van welke diensten je gebruik wilt maken en gebruik je enkel de middelen die je op dat moment nodig hebt.
Voice verandert het spel
Onze stem is een krachtig communicatiemiddel omdat het spontaan en intuïtief is. Voice maakt het mogelijk om op de meest natuurlijke manier met de technologie te communiceren, wat verklaart waarom het waarschijnlijk de meest universele gebruikersinterface is. Inderdaad, wanneer je jouw stem gebruikt, hoef je je niet aan te passen of de logica van een nieuwe interface te leren. Het is dus niet nodig om je aan elke applicatie aan te passen en je hoeft geen specifieke applicatie te vinden om een bepaalde taak te volbrengen. Met al deze voordelen verandert voice het spel in onze interacties met digitale systemen.
Tot twee of drie jaar geleden beschikten we niet over de mogelijkheden om op grote schaal in realtime spraak te verwerken. Grootschalige spraakverwerking is nu een realiteit om een aantal redenen, waaronder het grote aantal beschikbare stemgegevens, softwarevooruitgang met verwerkingsengines zoals Caffe, MXNet en Tensorflow. De ontwikkeling van massaal parallelle verwerkingsmachines die geheugentoegang met een lage latentie mogelijk maken.
Tegenwoordig worden spraaktoepassingen gebruikt voor alledaagse taken, zoals het luisteren naar muziek, winkelen, het besturen van de aangesloten huisinstallaties of zelfs het zoeken naar een route. Al deze functies worden mogelijk gemaakt door de intelligentie van stemassistenten, gebaseerd op een platform voor natuurlijke taalverwerking, zelf gebaseerd op algoritmen voor het leren van machines. Zo blijven stemassistenten leren en hebben ze nu tienduizenden vaardigheden die buiten het dagelijkse leven vallen. Het gebruik van voice in een professionele omgeving opent de deur naar tal van mogelijkheden.
Obstakels
Op het werk heeft het personeel interactie met verschillende applicaties en systemen. Waarom zou je dus geen spraakinterfaces gebruiken om al deze gebruiksscenario’s te activeren? Een van de obstakels is de moeilijkheid om grootschalige spraakgestuurde interacties en apparaten te beheren.
In feite zijn drie elementen essentieel voor het gebruik van spraak in een professionele context: beheer, integratie van api’s met toepassingen/infrastructuur, en de apparatuur van compatibele apparaten.
De spraakinterfaces zijn een echte revolutie en het is noodzakelijk om de integratie van spraakmogelijkheden met een maximum aan apparaten te vergemakkelijken. Deze nieuwe tools moeten bedrijven en ontwikkelaars ook in staat stellen om specifieke vaardigheden te ontwikkelen voor de taken die hen interesseren en zelfs om de toegang tot hun werknemers te reserveren als ze dat willen. In slechts een paar maanden tijd hebben AWS-klanten met Alexa for Business honderden interne vaardigheden ontwikkeld waarmee hun medewerkers allerlei soorten bewerkingen uitvoeren via spraakopdrachten, zoals toegang tot interne briefings of de vraag hoe laat hun it-afdeling sluit.
Stem-assistent
Net zoals een stem-assistent het beheren van een verbonden huis eenvoudiger maakt, zijn dezelfde functies op het werk te benutten. Een stem-assistent is te gebruiken om je omgeving te beheren, de weg te vinden, een hotelkamer te boeken, een probleem te melden of vervoer te vinden.
Een tijdrovende en oninteressante activiteit van werknemers binnen een bedrijf heeft bijvoorbeeld betrekking op het beheer van vergaderruimten (zoeken, reserveren, annuleren). Het gebruik van kunstmatige intelligentie op dit gebied via spraak verbetert de ervaring en productiviteit op dit gebied.
Het merendeel van de vergaderingen begint niet op tijd omdat het vaak moeilijk is om de aanmeldingsgegevens te vinden of de gevraagde cijfers en codes in te voeren. Met een tool als Alexa for Business zet de beheerder conferentiekamers op en integreert agenda’s met apparaten. Zeg ‘Alexa, start mijn vergadering’ om een vergadering te starten. Alexa for Business detecteert automatisch welke vergadering het is met de ingebouwde agenda, voert toegangsinformatie in, maakt verbinding met het vergaderingssysteem en start de vergadering. De tool kan het projectiescherm automatisch laten zakken en het licht dimmen. Telewerkers kunnen ook automatisch inloggen op de vergadering in hun agenda.
Spraakgestuurde applicaties
Tegenwoordig kunnen stemassistenten nog steeds communiceren met een groot aantal bedrijfstoepassingen, maar spraakinterfaces zullen pas van de grond komen wanneer er meer spraakgestuurde applicaties beschikbaar zijn. Alexa communiceert bijvoorbeeld met zakelijke applicaties, waaronder Salesforce, Concur en ServiceNow. It-ontwikkelaars die gebruik willen maken van spraakinterfaces activeren hun aangepaste toepassingen met behulp van de Alexa Skills Kit en stellen hun vaardigheden exclusief ter beschikking van hun organisatie. Er zijn agentschappen die kunnen helpen en er zijn codevoorschriften met codevoorbeelden voor AWS-services.
We zijn getuige van de opkomst van interessante gebruiksscenario’s op basis van stemassistenten. WeWork, een leverancier van gedeelde werkruimten en aanverwante diensten, heeft genoemde stem-assistent geïntegreerd in de dagelijkse activiteiten. Het bedrijf heeft privévaardigheden ontwikkeld die werknemers kunnen gebruiken om conferentiekamers te boeken, supporttickets in te dienen voor technische ondersteuning en informatie te verkrijgen over de beschikbaarheid van vergaderruimte.
Wij verheugen ons op de volgende generatie zakelijke applicaties die zijn gebaseerd op conversationele interfaces.
Auteur Werner Vogels is cto bij Amazon.com.