VoxML (Voice Markup Language)

VoxML (Voice Markup Language) é uma tecnologia da Motorola para criar um diálogo de voz com um Web site no qual um usuário pode ligar para um Web site por telefone e interagir com ele através do reconhecimento de voz e das respostas do Web site. VoxML (TM) permite que um desenvolvedor crie um script da conversa que um usuário pode ter com um programa aplicativo executado por um servidor Web. O usuário que liga é conectado a um programa cliente chamado voice browser. O navegador de voz, por sua vez, passa os pedidos para o servidor Web. A marcação definida em VoxML é consistente com a Extensible Markup Language (XML), a linguagem de definição estratégica de dados para a Internet. O uso da VoxML não pretende ser mais difícil do que escrever uma página Web usando a Hypertext Markup Language (HTML).

Motorola está fornecendo a VoxML como uma interface aberta e potenciais desenvolvedores podem fazer o download do kit de desenvolvimento a partir do site da Motorola. A Motorola já forneceu a tecnologia para alguns dos primeiros desenvolvedores de produtos, incluindo The Weather Channel (Canal Meteorológico). As aplicações típicas podem incluir o fornecimento de informações meteorológicas, informações de voo e pontuações desportivas, bem como pedidos de produtos e serviços online.

Como o usuário usa o VoxML

  1. O usuário identificaria um site que oferecesse interação telefônica. Por exemplo, alguns sites de e-tailing podem permitir aos utilizadores fazer encomendas a partir do site por telefone em vez de preencher um formulário.
  2. A empresa com o site publicaria um número de telefone para ligar para o seu site.
  3. O utilizador ligaria para o número de um telefone normal. (Inicialmente, - ou seja, fazer a ligação telefônica através da própria Internet - não é suportado.)
  4. O usuário se conectaria a um navegador de voz no Web site.
  5. Quando conectado, o usuário ouvia uma voz gravada que convidava o usuário a interagir com o Web site - por exemplo, para fazer um pedido ou escolher alguma outra opção.
  6. Como o usuário respondia, as respostas selecionadas poderiam acionar pedidos do navegador de voz para uma aplicação do servidor Web. O servidor Web também poderia enviar de volta novas páginas Web para o computador do usuário - por exemplo, imagens de itens de catálogo e confirmações de pedidos.
  7. O usuário e o aplicativo VoxML interagiriam até que a transação fosse concluída. Então o usuário desligava, terminando a sessão.

Como o desenvolvedor desenvolve uma aplicação VoxML

    1. Primeiro, o desenvolvedor desenha e especifica a aplicação, anotando os possíveis diálogos de voz que serão possíveis.
    2. Trabalhar em um PC normal que tenha o software de desenvolvimento instalado, o desenvolvedor usa VoxML, as instruções de diálogo do usuário e os nomes dos arquivos de resposta de áudio gravados para criar um arquivo que formalmente defina os diálogos.
    3. O desenvolvedor (ou outra pessoa) grava cada possível consulta de voz, criando um arquivo de voz contra o qual as entradas de voz dos usuários podem ser combinadas. O desenvolvedor organiza qualquer resposta de voz predefinida, que pode estar disponível em outro aplicativo.
    4. O desenvolvedor tem o cliente de voz no PC para que o script VoxML possa ser testado.
    5. Após o teste, todos os arquivos são colocados no servidor do Web site.
    6. O desenvolvedor modifica o site para convidar os usuários a solicitar o aplicativo de voz.
    7. Após a configuração do aplicativo VoxML, os usuários podem interagir com o site através do mouse e teclado, como de costume, e também, para fins de convite, através de um telefone.