Poviete „nastav budík na sedem“ a stane sa to. Medzi vaším hlasom a splnenou úlohou pritom prebehne niekoľko krokov, a to za zlomok sekundy.
Zo zvuku na text
Najprv mikrofón zachytí váš hlas a systém ho premení na text, teda rozpozná, ktoré zvuky zodpovedajú ktorým slovám. Práve tu sa asistenti najviac zlepšili: dnes zvládnu aj rôzne prízvuky či hluk v pozadí, na čom staršie systémy zlyhávali.
Z textu na význam
Samotný text ešte nestačí, asistent musí pochopiť, čo ním chcete. Rozanalyzuje vetu a hľadá v nej zámer (nastaviť budík) a údaje (o siedmej). Naučil sa to z obrovského množstva príkladov, ako ľudia formulujú rovnakú požiadavku rôznymi slovami.
Prečo počúva stále
Asistent načúva len na takzvané budiace slovo. Dovtedy spracúva zvuk len v zariadení a neukladá ho. Až keď budiace slovo zachytí, začne nahrávať príkaz. To je dôvod, prečo občas zareaguje, aj keď ste ho nevolali: pomýlil si podobne znejúce slovo.
Kde sú jeho hranice
Asistent je skvelý na jednoduché, jasné príkazy. Horšie mu ide zložitejšia konverzácia, irónia alebo viackrokové úlohy. Aj preto sa stále vyvíja smerom k modelom, ktoré rozumejú reči pružnejšie a vedia nadviazať na predchádzajúcu otázku.