Използването на системи за разпознаване на реч

Основното предимство на гласови системи са удобни за ползване. Сега достатъчно произнасянето целта на разговора, след което системата автоматично се движи гласа на обаждащия се да желаното меню.

Търговска програма за разпознаване на реч започва в началото на деветдесетте години. Те обикновено се използва от хора, които, заради травма на ръката не е в състояние да получат по-голямо количество текст. Тези програми (например, Dragon NaturallySpeaking, VoiceNavigator) глас на потребителя се превръща в текст, като по този начин облекчаване на ръцете му. Надеждност на прехвърляне на тези програми не е много висока, но с течение на годините той постепенно се подобряваше.

Увеличението на изчислителната мощност на мобилни устройства и им позволи да създадат програми с функция за разпознаване на реч. Сред тези програми е да се отбележи, Microsoft Voice Command приложение, което ви позволява да работите с много приложения, използващи вашия глас. Например, можете да включите възпроизвеждане на музика от плейъра, или да създадете нов документ.

Следващата стъпка на технологии за разпознаване на реч може да се счита за развитие на т.нар Silent Реч интерфейси (SSI) (безшумен реч интерфейс). Това система за обработка на реч въз основа на получаването и обработката на говорни сигнали на ранен етап на ставната. Този етап на развитие на разпознаване на реч се причинява от два съществени недостатъци на съвременните системи за разпознаване прекомерна чувствителност към шум, както и необходимостта от ясна и точна реч като се позовава на системата за признаване. Един подход, основан на SSI, е да използвате новите сензори не са засегнати от шума, като добавка към обработените акустични сигнали.

Днес можем да идентифицираме пет основни области на използване на системи за разпознаване на реч:

§ Гласово набиране различни техники (мобилни телефони, компютри и т.н.).

Voice - процес взаимодействие и контрол в работата на устройството с помощта на гласови команди. Системи за гласов контрол са неефективни за въвеждане на текст, но е удобно да въведете komanl, като:

Днес има два вида системи за разпознаване на реч - работещи "на клиента» (базирани на клиенти) и на принципа на "клиент-сървър" (клиент-сървър). При използване на клиент-сървър технология гласова инструкция се влезе в устройството на потребителя и се предава чрез Интернет към отдалечен сървър, където се преработват и се върна на устройството като команда (Google Voice, Vlingo, Аве.); поради големия брой на потребителите на системата за разпознаване на сървъра получава чудесна база за обучение. Първото изпълнение работи на математически алгоритми и други редки (Speereo Software) - в този случай командата се въвежда в устройството на потребителя обработват в регистъра в един и същ. Плюс обработка "клиент" в мобилността, независимо от връзката и експлоатация на оборудване с дистанционно. По този начин, системата работи "на клиента" изглежда по-надежден, но се ограничава до, от време на време, захранването му от страна на потребителя.

Сега технология се използва и SIND (без да се позовава на гласа на конкретен човек).

[1] Дейвис. К.Н. Бидълф, R. и Balashek, S. (1952) Автоматично разпознаване на реч Устни цифри. J. Acoust. Soc. Am. 24 (6), стр. 637-642