Ako ti rozumie hlasový asistent

Poviete „nastav budík na sedem“ a stane sa to. Medzi vaším hlasom a splnenou úlohou pritom prebehne niekoľko krokov, a to za zlomok sekundy.

Zo zvuku na text

Najprv mikrofón zachytí váš hlas a systém ho premení na text, teda rozpozná, ktoré zvuky zodpovedajú ktorým slovám. Práve tu sa asistenti najviac zlepšili: dnes zvládnu aj rôzne prízvuky či hluk v pozadí, na čom staršie systémy zlyhávali.

Z textu na význam

Samotný text ešte nestačí, asistent musí pochopiť, čo ním chcete. Rozanalyzuje vetu a hľadá v nej zámer (nastaviť budík) a údaje (o siedmej). Naučil sa to z obrovského množstva príkladov, ako ľudia formulujú rovnakú požiadavku rôznymi slovami.

Prečo počúva stále

Asistent načúva len na takzvané budiace slovo. Dovtedy spracúva zvuk len v zariadení a neukladá ho. Až keď budiace slovo zachytí, začne nahrávať príkaz. To je dôvod, prečo občas zareaguje, aj keď ste ho nevolali: pomýlil si podobne znejúce slovo.

Kde sú jeho hranice

Asistent je skvelý na jednoduché, jasné príkazy. Horšie mu ide zložitejšia konverzácia, irónia alebo viackrokové úlohy. Aj preto sa stále vyvíja smerom k modelom, ktoré rozumejú reči pružnejšie a vedia nadviazať na predchádzajúcu otázku.

M
AutorMilan

Milan píše o technológiách, umelej inteligencii a vesmíre. Zložité veci rád vysvetľuje jednoducho a po ľudsky.