UMĚLÁ INTELIGENCE V AUTOMOTIVE / David et al.
Autentizace mluvčího může zjednodušit úlohu překladu řeči v systémech, které byly trénovány na konkrétní hlasy, nebo jej lze použít k ověření či ověření identity mluv čího v rámci bezpečnostního procesu. Autentizace mluvčích využívá akustické vlastnosti řeči, u kterých bylo zjištěno, že se mezi jednotlivci liší. Tyto akustické vzorce odrážejí jak anatomii, tak naučené vzorce chování [8.15]. V rámci autentizačního procesu může být analyzováno více než 100 fyzických a behaviorálních faktorů a vytváří jedinečný hlasový otisk pro každého jednotlivce. Tyto faktory zahrnují výslovnost, důraz, rychlost řeči a přízvuky a také fyzické vlastnosti, jako je hlasový trakt, ústa a nosní dutiny. Hlasová identifikace se vyskytuje ve dvou formách: Může být pasivní, kdy je řeč uživatele porovnána s dříve zaznamenaným hlasovým otiskem. Nebo může být aktivní, kdy jsou volající požádáni, aby odříkali předem určenou přístupovou frázi a jejich hlas se shodoval s hlasovým otiskem uloženým v databázi. Hlasový otisk je vytvořen redukcí každého mluveného slova na segmenty složené z několika dominantních frekvencí, které jsou pak segmentovány podle tónů zachyce ných v digitálním formátu. Tyto tóny společně identifikují jedinečný hlasový tisk mluv čího, který se stává jejich jedinečným hlasovým vzorem. Na obrázku je znázorněn zjednodušený princip autentizace mluvčího.
Obr. 8.10 Princip autentizace mluvčího [8.16] Jak již bylo výše naznačeno rozpoznávání řeči, stejně jako syntéza řeči, identifikace mluvčího nebo ověření mluvčího, jsou některé z technik zpracování řeči. Tyto techniky, umožňují zejména vyrábět rozhraní člověk-stroj (HMI), kde je část interakce prováděna hlasem označovaná jako „hlasová rozhraní “. Existují dvě hlavní aplikace technologií a metodologií rozpoznávání mluvčích. Pokud mluvčí tvrdí, že má určitou identitu, a k ověření tohoto tvrzení je použit hlas, na-
124
Made with FlippingBook - Share PDF online