ŠAVŠ Studie 2022 (6)

5.4.1 Rozpoznávací systém Na obrázku 5.2 je znázorněno blokové schéma typického systému rozpoznávání hlasu. Systém je koncipován tak, aby rozpoznával hlas osoby tím, že každá osoba prone se do mikrofonu konkrétní výrok. Řečový signál je digitalizován a je provedeno určité zpracování signálu, aby se vytvořila šablona pro hlasový vzor, který se uloží do paměti. Obr. 5.2: Blokové schéma typického systému rozpoznávání řeči

Zdroj: VENAYAGAMOORTHY. G. K.,1998 Systém rozpozná mluvčího porovnáním promluvy s příslušnou šablonou ulože nou v paměti. Když dojde ke shodě, mluvčí je identifikován. Dvě důležité operace v identifikátoru jsou extrakce parametrů, kdy se z výpovědí každé osoby získávají odlišné vzory a používají se k vytvoření šablony, a porovnávání vzorů, kde jsou šablony porovnávány s těmi, které jsou uloženy v paměti. Obvykle se pro porovnávání vzorů používají korelační techniky. Z technického hlediska lze blokové schéma z obrázku 5.2 transformovat blokové schéma znázorňující technickou instrumentaci potřebnou k rozpoznávání hlasu – obr. 5.3. Obr. 5.3: Blokové schéma technické instrumentace systému rozpoznávání hlasu

Zdroj: VENAYAGAMOORTHY. G. K.,1998

5.4.2 Extrakce charakteristických vlastností Extrakce příznaků hraje velmi důležitou roli v identifikaci mluvčího. Lidskou řeč lze rozumně interpretovat pomocí frekvenčně-časových interpretací, jako je spek trogram. K rozlišení hlasů lze použít frekvenčně-energetické interpretace a výkonové spektrální hustoty. Dalšími metodami, které lze pro tento účel použít, jsou lineární prediktivní kódování a kepstrální analýza. Základem zpracování je Fourierova transformace diskrétního vzorku, která je dána vztahem:

159

Made with FlippingBook - Share PDF online