30
VoiceXML Теория и практика проектирования голосовых приложений Александр Ворон [email protected]

VoiceXML. Теория и практика проектирования голосовых приложений

Embed Size (px)

DESCRIPTION

Доклад на Application Developer Dayshttp://addconf.ru/event.sdf/ru/add_3/authors/AlexanderVoron/744

Citation preview

Page 1: VoiceXML. Теория и практика проектирования голосовых приложений

VoiceXML Теория и практика проектирования голосовых

приложений

Александр Ворон[email protected]

Page 2: VoiceXML. Теория и практика проектирования голосовых приложений

Зачем?

Page 3: VoiceXML. Теория и практика проектирования голосовых приложений

Типы голосовых приложений

• Call центры– РЖД: +7 (800) 775 00 00– Шереметьево: +7 (495) 956 46 66

• Персональные помощники– Siri

• Информационные службы• Приложения для слепых– IBM Home Page Reader

• Приложения для коммерции

Page 4: VoiceXML. Теория и практика проектирования голосовых приложений

Этапы создания приложения

1. Определение• требования• высокоуровневый дизайн

2. Проектирование3. Реализация• разработка• тестирование• настройка

Page 5: VoiceXML. Теория и практика проектирования голосовых приложений

Типы диалогов

Диалог, управляемый приложением

Page 6: VoiceXML. Теория и практика проектирования голосовых приложений

Выберите одну из закусок: пицца, гамбургер, шаурма.

ПиццаВыберите тип пиццы: мясная, грибная, сырная.

МяснаяВыберите размер пиццы: средняя, большая.

БольшаяВыберите напиток…

@#&!

Page 7: VoiceXML. Теория и практика проектирования голосовых приложений

Типы диалогов

Естественный диалог

Page 8: VoiceXML. Теория и практика проектирования голосовых приложений

Выберите одну из закусок: пицца, гамбургер, шаурма.

Я хочу большую мясную пиццу с колой!

Ваш заказ будет готов через 15 минут.

Page 9: VoiceXML. Теория и практика проектирования голосовых приложений

Обработка ошибок

@#&!

• Ответ пользователя не распознан• Пользователь ничего не ответил

Page 10: VoiceXML. Теория и практика проектирования голосовых приложений

Для идентификации мне нужен номер Вашей бонусной карты.

Простите?

Простите, я Вас не услышал. Пожалуйста, назовите 10-

значный номер, указанный на титульной стороне Вашей

бонусной карты.

Простите, я не понял Ваш ответ.

Пожалуйста, назовите 10-значный номер, указанный на

титульной стороне Вашей бонусной карты.

Какой номер у Вашей бонусной карты?

Извините, я все еще не понял. Пожалуйста, наберите номер Вашей бонусной карты на клавиатуре телефона или скажите «Я

не знаю» и я соединю Вас с оператором.

Page 11: VoiceXML. Теория и практика проектирования голосовых приложений

Этапы создания приложения

1. Определение• требования• высокоуровневый дизайн

2. Проектирование3. Реализация• разработка• тестирование• настройка

Page 12: VoiceXML. Теория и практика проектирования голосовых приложений

«Голосовая» панель управления

• помощь / повторить• главное меню / назад• оператор / до свидания

Page 13: VoiceXML. Теория и практика проектирования голосовых приложений

………..…………………………………..……………..….... Легко!Сначала надо его покрутить. После – достать его содержимое и подогреть. Не забудьте выкинуть оболочку, или, в крайнем случае, отдайте ее бабушке.

Контекст

???

Page 14: VoiceXML. Теория и практика проектирования голосовых приложений

Хотите приготовить обед из одного яйца? Легко!Сначала надо его покрутить. После – достать его содержимое и подогреть. Не забудьте выкинуть оболочку, или, в крайнем случае, отдайте ее бабушке.

Контекст

Яичница!

Page 15: VoiceXML. Теория и практика проектирования голосовых приложений

Этапы создания приложения

1. Определение• требования• высокоуровневый дизайн

2. Проектирование3. Реализация• разработка• тестирование• настройка

Page 16: VoiceXML. Теория и практика проектирования голосовых приложений

Что такое VoiceXML?

VoiceXML – язык разметки, предназначенный для описания голосовых диалогов между человеком и приложением.

речь, кнопки телефона

сообщения

Page 17: VoiceXML. Теория и практика проектирования голосовых приложений

Добро пожаловать на голосовой портал компании «Мера». Чем я могу помочь?

Голосовой интерфейс

Системные сообщения

Page 18: VoiceXML. Теория и практика проектирования голосовых приложений

Добро пожаловать на голосовой портал компании «Мера». Чем я могу помочь?

Я хочу узнать вакансии компании.

Голосовой интерфейс

Грамматики

Page 19: VoiceXML. Теория и практика проектирования голосовых приложений

Добро пожаловать на голосовой портал компании «Мера». Чем я могу помочь?

Я хочу узнать вакансии компании.

Есть вакансии для С++, Java и .NET программистов. О какой вакансии Вы хотите узнать подробнее?

Голосовой интерфейс

Поток управления

Page 20: VoiceXML. Теория и практика проектирования голосовых приложений

Преимущества VXML

• Является открытым стандартом W3C• Высокоуровневый язык• Предназначен для разработки только

голосовых приложений• Разделение логики представления (VXML)

от бизнес-логики (ASP, JSP, CGI)

Page 21: VoiceXML. Теория и практика проектирования голосовых приложений

Особенности VoiceXML

• Генерация документов на стороне сервера (ASP, JSP, CGI)

• Использование ECMAScript• Управление событиями• Переадресация звонка

Page 22: VoiceXML. Теория и практика проектирования голосовых приложений

Платформы VoiceXMLПроизводитель Продукт TTS ASR

Advanced Technology Solutions IVR Center Realspeak 4.5 Nuance

Recognizer 9.0.6

Genesys Genesys Voice Portal Realspeak 4.5 Nuance

Recognizer 9.0.7

Holly Connects Holly Voice Platform

Vocalizer NSS 5.0.8 Nuance 9.0.11

Loquendo VoxNauta Platform Loquendo TTS 7.8.4

Loquendo ASR 7.8.1

Nuance Nuance Voice Platform

Nuance Vocalizer5.0.2

Nuance Recognizer 9.0.12

www.voicexml.org/platform-certification

Page 23: VoiceXML. Теория и практика проектирования голосовых приложений

Архитектура VXML

Сервер приложений

Платформа

Web сервисы

Базы данных

VXML интерпретатор

ASR TTS Audio

Page 24: VoiceXML. Теория и практика проектирования голосовых приложений

Поддиалог

employee.vxml

Page 25: VoiceXML. Теория и практика проектирования голосовых приложений

identify.vxml

Поле ввода имени

Поле ввода должности

Page 26: VoiceXML. Теория и практика проектирования голосовых приложений

identify.vxml

Грамматика

Page 27: VoiceXML. Теория и практика проектирования голосовых приложений

identify.vxml

Обработка ответа пользователя

Page 28: VoiceXML. Теория и практика проектирования голосовых приложений

Блок исполняемых команд

employee.vxml

Page 29: VoiceXML. Теория и практика проектирования голосовых приложений

Источники

• The Voice Browser Working Group www.w3.org/voice

• K. Rehor “World of VXML” www.kenrehor.com/voicexml

• C. Shukla “VoiceXML 2.0 Developer’s Guide”• R. Harris “Voice Interaction Design”• H. Cohen “Voice User Interface Design”

Page 30: VoiceXML. Теория и практика проектирования голосовых приложений

Спасибо за внимание

VoiceXML

Теория и практика проектирования голосовых приложений

Александр Ворон[email protected]