Wake word

Uma palavra despertar é uma frase que faz com que um dispositivo Amazon Echo comece a gravar um pedido do usuário final para que ele possa ser enviado para a nuvem para processamento. Quando o Amazon Echo detecta sua palavra despertar, ele grava o próximo pedido falado e envia uma gravação do pedido do usuário para Amazon Web Services (AWS). Os computadores Amazon Echo na nuvem processam o pedido do usuário e enviam uma resposta ou iniciam uma ação.

Amazon Echo os usuários emitem a palavra de despertar quando querem ativar e se envolver com o dispositivo. "Alexa" é a palavra de despertar padrão do Echo, mas os usuários podem mudar o padrão para "Amazon", "Echo" ou "Computer" se desejado. O termo palavra de despertar é análogo ao termo hotword, que é usado para ativar a interface de voz do usuário (VUI) no Google Home.

Enquanto o dispositivo Echo está constantemente escutando, ele só grava e transmite áudio após a palavra de despertar ter sido dita. Os usuários podem rever e excluir suas gravações de voz dos servidores da Amazon através do aplicativo Alexa ou visitando a página do Alexa Privacy Settings.  Os usuários finais também podem solicitar que o Alexa toque um tom curto para indicar que o dispositivo ouviu a palavra de despertar e o áudio está sendo enviado para a nuvem.

Como funcionam as palavras de despertar?

O Amazon Echo usa um aprendizado profundo, um aspecto de inteligência artificial, para ensinar o software Echo a reconhecer a palavra de despertar. Apesar do Amazon Echo estar constantemente ouvindo, O buffer de áudio do Echo impede que o dispositivo escute e grave conversas inteiras. 

Segundo a Amazon, os dispositivos Echo têm um buffer de gravação de apenas alguns segundos, que é apenas o suficiente para detectar a palavra wake. Amazon usa interações de voz de clientes do mundo real para ajudar a treinar seus algoritmos de rede neural. Quando gravações de áudio estão sendo transmitidas para os Serviços de Voz Alexa (AVS) da Amazon baseados em nuvem, o dispositivo Echo também alertará visualmente o usuário final. (O anel fino no Amazon Echo ficará azul e piscará.) Quando a palavra wake estiver sendo alterada, a luz no dispositivo piscará brevemente em laranja. 

Todos os dispositivos Amazon Echo possuem múltiplos microfones embutidos que ajudam o dispositivo a ignorar ruídos de fundo e decifrar palavras de wake faladas à distância. Para evitar que o Alexa seja despertado acidentalmente, companies podem enviar amostras de áudio para a Amazon para ter instâncias específicas da palavra wake ignoradas. Por exemplo, uma empresa que faz um comercial de televisão sobre o "Alexa" pode submeter o áudio para a Amazon.

Using a technique called acoustic fingerprinting, Amazon can detect when multiple devices are hearing the same command at around the same time (during a television commercial for Alexa, for example). When the Super Bowl between the New England Patriots and the Los Angeles Rams was broadcast in January 2019, an Amazon Echo commercial featuring the actor Forest Whitaker aired. Amazon utilized a recording of the commercial, along with acoustic fingerprinting, to ignore the wake word, "Alexa," whenever Whitaker uttered it.