Voice потребителски интерфейс научна фантастика или реалност, говорни технологии

Звукозаписи, записани с помощта на цифрови диктофони "Gnome P" и "Gnome 2М" отговарят на изискванията на звукозаписи идва phonoscopic за изпити, и са подходящи за персонален идентификационен с глас и реч.

Първи заместник-началник

Recorder "Gnome 2М" е многократно използван за запис на конференции и семинари в различни слухови ситуации, записан саундтрак с високо качество. Вграден намаляване на шума може да се подобри качеството на саундтраци играят.

Водещият инженер PKI BSTU

Институт за напреднали обучение и преквалификация на персонала Беларуски национален технически университет

През периода на действие "Gnome P" се е утвърдил на положителната страна. Високо качество на запис с минимални размери, голяма продължителност на записа, бърз трансфер на информацията, съхранена в паметта на записващото устройство към компютъра.

Високопоставен служител на 3-ти отдел на седмата контрола

Генералния щаб на Въоръжените сили на Република Беларус

Членка Съдебна Център

Неограничен брой абонати са уведомени, голям брой едновременни задачи направи "рог" незаменим инструмент в работата на служителите на кредитен отдел на клон номер 524 на "Belarusbank на.

Заместник-директор - ръководител на Бизнес център на дребно

Номер на клон 524 на "Belarusbank"

Изпълняващ длъжността военен комисар

Военен комисариат на Минск

"Забравете-Me-II» система за запис ви позволява да получавате гласови съобщения наематели, запис с високо качество на компютър, можете да слушате записани съобщения и въвеждане на информация в база данни на текст. "Хорн" система за предупреждение произвежда автоматично уведомяване на длъжниците.

Ръководител на ИТ отдела

UE ", област ZHREO Съветския на Минск"

"Мегафон" Системата предоставя уведомление за голям брой клиенти в най-кратък срок в съответствие с параметрите на предоставяне на доклад за проведено от уведомление, работи надеждно, напълно отговаря на изискванията, представени за нея.

Директор на бизнес отдел на дребно

Подвижната система за регистриране и документиране на словото "Протокол" включва цифров диктофон "Gnome 2М" и компютър Transcriber "Цезар". Recorder "Gnome 2М" ви позволява да получавате висококачествен запис на срещи и сесии и Transcriber "Цезар" значително увеличава скоростта на превод на аудио информация в текстов документ.

Институт за държавата и правото на Академията на науките на Беларус

В областта на информационните технологии означава взаимодействие на потребителя с техническата система се нарича интерфейс. Интерфейси са различни и се прилагат по различни начини и методи. Например, всички известни графичен потребителски интерфейс, който се основава на използването на компютърната графика, за да покаже на потребителя необходимата информация в визуална форма. Трябва да се отбележи, че един от най-важните задачи на развитието на съвременните технически системи е да осигури лесен за употреба интерфейс с потребителя. С други думи, днешните компютърни приложения стават все по-фокусирани върху нуждите на потребителя.

Очевидно е, че един от най-естествените форми на взаимодействие за лицето говори. Смята се, че един глас интерфейс може да се подобри съществуващата потребителския интерфейс, тъй като се смята, че тя осигурява по-удобен и по-малко ограничен начин на взаимодействието човек-компютър. Voice потребителски интерфейс е може би най-решаващият фактор за успеха на всяка една система за автоматично разпознаване на реч, от това зависи до голяма степен от това, което работата на потребителите от използването на системата.

Voice потребителски интерфейс позволява на човек да си взаимодействат с компютъра с цел стартиране на автоматизиран процес или услуга. Гласови елементи на потребителския интерфейс са системни подканите, граматиката и алгоритъм диалог. Съвети, или системни съобщения са предварително записани или синтезира реплика, потребителят чува по време на диалога. Граматика съдържа набор от възможни въпроси и отговорите на потребителя. Системата може да разпознае само тези думи, изречения или изрази, които са включени в граматиката. Съгласно алгоритъм диалог е последователност от действия, които система изпълнява.

Voice потребителски интерфейс научна фантастика или реалност, говорни технологии

Движеща система с гласови потребителски интерфейс

Въпреки нарастващото значение, не всички задачи глас интерфейс дизайн вече могат да се разглеждат като уредено. Проблемът на глас интерфейс дизайн е доста сложно и комплексно, поиска от възложителя на знания в различни области. За да създадете качеството на гласа потребителски интерфейс изисква познания по компютърни науки, лингвистиката и психологията на човешкото поведение. Дори и при наличието на съвременни инструменти за проектиране, разработване на ефективна глас потребителски интерфейс изисква детайлно разбиране на основателите й като задачите, изпълнявани от системата, както и психологията на потребителите на системата.

  1. Като човек обикновено изпълнява тази задача?
  2. Възможно ли е да изпълни задачата в най-кратки броя на стъпките?
  3. Подобно на повечето хора възприемат този проблем; тяхната "мисловен модел" на този проблем?

Като се има предвид по-горе фактори, всеки глас потребителски интерфейс може да бъде подходящ за обработка на заявката, така че да прави един мъж.

Графичният потребителски интерфейс се използва за показване на информация на екрана на компютъра. Лентата с инструменти е фиксирана: той остава на екрана, и иконите в него не са се променили. лента с инструменти Постоянство намалява необходимостта за потребителя запомните поредица от действия и команди. Той също така представлява поток от звуци. Поради това, човек трябва да разчита на паметта си да си спомни какво се е случило преди няколко секунди или минути. Това означава, че разработчиците на гласови потребителски интерфейси трябва да бъдат наблюдавани товар, който те упражняват върху паметта на потребителя. Постигане на приемливо ниво на "когнитивното натоварване" е един от ключовите моменти в създаването на лесен за използване потребителски интерфейс глас.

Както бе споменато по-горе, да се предвиди потребителски отговори - този проблем е ефективно разработена граматика. Граматика установи, че системата може да се "разбират" и как да се реагира на него. Системата, която включва граматика максимизира ограничен набор от думи, признава само отговорите с "да", "не", а продължителен граматиката позволява на системата да разпознае точно такива отговори като "да, моля", "ммм. аха "," да ". Някои от граматиката позволява да признае отговори от рода на "не знам", а след това системата предлага няколко опции за да помогне на потребителя да вземе решение.

За съжаление, понякога потребителят общува с системна грешка се появява и лошата комуникация. В очакване на появата на най-честите грешки, които предлагат на потребителя ясно и адекватно отговор на въпроси на отговорите му, един глас интерфейс да зададете правилния курс на диалог и бързо коригиране на грешки, когато те се появят. Например, ако даден потребител е безшумен, очевидно без да знае какво да каже, системата може да се разшири, за да му задам един въпрос:

Voice потребителски интерфейс научна фантастика или реалност, говорни технологии

Ако отговорът потребител все още не е същото като тези, съдържащи се в граматиката, това може да доведе до грешка при разпознаване, така че системата трябва да се изясни как да се отговори на:

Voice потребителски интерфейс научна фантастика или реалност, говорни технологии

Ако системата все още не може да се справи с една грешка, тя изисква от потребителя да прехвърли обаждането на оператора.

Ако говорим за навигация на системата, трябва да се отбележи, че работата с прилагането, потребителят винаги трябва да бъде в състояние да се върнете една стъпка в диалога, за пореден път да слушате системата последното съобщение или да пропуснете всяко ниво на разговор и просто отидете на следващия. Опции за потребителя команди за навигация в системата, за да бъдат включени в граматиката. Граматика трябва да съдържа всички възможни синоними отбори. Например, за екипа, "Повторение" трябва да се вземат под внимание редица синоними, като се започне от "Кажи отново, моля" до "Какво? ".

Наличието на хипервръзки позволява на потребителя да контролира допълнително обичайния ход на диалог. Включване на хипервръзката, потребителят може да пропуснете някои нива на диалог и веднага го удари на точното място на диалог. Типичен пример е хипервръзка към главното меню, спиране на работата с приложението, връзката с представителя на обслужване на клиентите и завършването на разговора.

Вие също трябва да мислим внимателно за това, което заповядва потребителят трябва да потвърди и кога. Потвърдете е особено необходимо в случаите, когато цената на провала е достатъчно висока, за избора на менюто. Както и с командата "Отказ", потребителят може случайно да попълнят диалог със системата и да се прекрати, например, процес резервация на билети.

Способността да се преустанови работата с приложението е необходимо да се потребители, които се нуждаят от допълнително време, например, да се намери номера на сметката си, или да вземете писалка и тетрадка, или работят с молба трябва да бъдат разсеяни, например, да карам кола. В такива случаи, по време на диалога е спряно, докато системата не получи подходящата потребителска команда, като например "Напред".

Важно е да се обърне специално внимание на качеството на звука и система за записване на съобщения. А правилно проектирани граматика, съдържащ всички възможни синоними, позволява различни отговорите на потребителя, но съобщава, системата трябва да бъде по-ясно. При разработването на глас на потребителския интерфейс, винаги трябва да се обясни на потребителя как той трябва да отговори. За тази цел, ако е валиден отговор не може да напомни на потребителя, разработчиците на приложения предвиждат редица ключови думи, които помагат на потребителя да даде ясен отговор на системата. Например, "Искате ли да" изберете дестинация "," за да получите информация за хотели, "или" престой "?"

Нека се спрем малко по съобщенията на системата. Към системата на съобщение няколко съвета, които могат да бъдат три вида:

Гласови съобщения са синтезирани или предварително записани фрази, или комбинация от двете. синтез на реч е по-подходящ за четене на глас на динамично съдържание, като например съобщения по електронната поща. От друга страна, записана реч, т.е. фрази, предварително записани в студиото на професионален актьор, по-точно да предадат изразителността на човешката реч и по-естествен диалог направи.

В много приложения тя е и звукова система за гласови съобщения. Така често се използва музикални лога, звуков сигнал, указващ, че е станала грешка, в началото на съобщението, звуците на околната среда.

Въпреки това, не всички бизнес операции подлежат на автоматизация, с използване на гласови потребителски интерфейс. Като правило, по-сложни заявки и операциите, а проблемните ги автоматизират и толкова по-вероятно, че в резултат няма да намерят популярност сред потребителите. Например, една гореща линия правен съвет е доста трудно да се автоматизира, така че в този случай, помощ оператор е единствената опция. От друга страна, използването на глас потребителски интерфейс на удобно за автоматизиране на бързи и повтарящи се сделки, като например обработка на поръчките, за отчитане на време или плащане, прехвърляне на средства от една сметка в друга.

Ето някои конкретни приложения на глас потребителски интерфейс, който вече се използва в различни системи:

Високо качество на звука интерфейс помага на потребителите да преодолеят отхвърляне технология, тъй като употребата му не е необходимо да се придобият нови умения. Общуването със системата, потребителят може да изпълнява различни операции бързо и лесно, като че ли да говорите с квалифициран техник. Voice интерфейс качествено променя начина, и по този начин ефективността на потребителското взаимодействие със системата. Тя ви позволява да работите с приложението по-естествено за човека.