VoiceXML
VoiceXML | |
---|---|
Орган стандартизации | Консорциум Всемирной паутины |
![]() |
VoiceXML(Voice eXtensible Markup Language,VXML) — один из открытых стандартовW3Cна основеXML-языка[1],протокол[2],диалоговый язык разметки. VoiceXML 3.0 станет следующей основной версией VoiceXML с новыми основными функциями. Он включает новый язык описания диаграмм состояний XML, называемый SCXML.
История
[править|править код]Май 2000 года — опубликование в международном консорциуме World Wide Web (W3 Consortium) первой версии. Предназначение — для разработки интерактивных голосовых приложений (Interactive Voice Response, IVR) управления медиаресурсами. Цель создания стандарта — привнесение всех преимуществ web-программирования в разработку IVR-приложений[1].
Многомодальные приложения, сочетающие распознавание речи с другими формами ввода информации (с клавиатуры, пера, набора цифровых кнопок) попали в поле зрения ряда крупных компаний (Microsoft и др.), которые решили поддержать проектSALT Forum(Speech Application Language Tags — теги языка речевых приложений). Поэтому теперь вокруг SALT и VoiceXML консорциума W3С формируются два разных лагеря. До сих пор компании не могут прийти к единому мнению о выборе главного стандарта и сейчас оба направления развиваются в равной степени[1].
При разработке пакетов (Software Development Kit,SDK) для создания речевых приложений компании поддерживают тот или иной стандарт. Например, пакет Speech SDK (от Philips) поддерживает спецификацию Voice XML и выполнен для связи с C/C++ API[1].
Спецификации, предложенные W3C:
- Voice Extensible Markup Language (VoiceXML) Version 2.0 — 16 марта 2004. Является частью W3C Speech Interface Framework, разработан в рамкахW3C Voice Browser ActivityучастникамиVoice Browser Working Group(недоступная ссылка).[3]
- Voice Extensible Markup Language (VoiceXML) 2.1 — 19 июня 2007[4]
- Voice Extensible Markup Language (VoiceXML) 3.0 (W3C Working Draft) — 4 марта 2010[5].Позволяет осуществлять голосовую идентификацию[6]
Использование
[править|править код]Десятки тысяч приложений уже созданы[7]
VoiceXML имеет теги, которые являются командами для голосового браузера (voice browser), который: синтезирует, распознает речь, предоставляет диалоговое управление.
Пример кода
[править|править код]Пример VoiceXML документа:
<vxmlversion="2.0"xmlns="http://www.w3.org/2001/vxml">
<form>
<block>
<prompt>
Привет,мир!
</prompt>
</block>
</form>
</vxml>
VoiceXML интерпретатор преобразует текстовую фразу «Привет, мир!» в синтезированную речь
Примечания
[править|править код]- ↑1234Современные технологии распознавания речиАрхивировано29 октября 2007 года.
- ↑Nortel выпустила новые решения для интеграции бизнес-процессов и приложений(недоступная ссылка)
- ↑Voice Extensible Markup Language (VoiceXML) Version 2.0 .Дата обращения: 6 апреля 2010.Архивировано12 апреля 2010 года.
- ↑Voice Extensible Markup Language (VoiceXML) 2.1 .Дата обращения: 6 апреля 2010.Архивировано7 мая 2021 года.
- ↑Voice Extensible Markup Language (VoiceXML) 3.0 .Дата обращения: 6 апреля 2010.Архивировано2 марта 2021 года.
- ↑Центр развития и внедрения компьютерных и информационных технологий UzInfoComАрхивировано25 октября 2011 года.
- ↑VoiceXML Forum .Дата обращения: 6 апреля 2010.Архивировано5 мая 2021 года.
См. также
[править|править код]Ссылки
[править|править код]- К российским речевым технологиям получат доступ иностранцы
- Особенности разработки инфокоммуникационных услуг на языке VoiceXML
- LumenVox — технология распознавания речи для AsteriskАрхивная копияот 27 июня 2009 наWayback Machine
- VXML Forum создает стандарт
- VoiceXML Development Guide, Version 2.1(англ.)