Disfluência da fala

Uma disfluência da fala é qualquer perturbação no fluxo da linguagem falada que é causada pelo falante. Os tipos de disfluências de fala incluem gagueira e hesitações, assim como os preenchimentos que as pessoas inserem para evitar pausas estranhas enquanto encontram suas próximas palavras e talvez garantir que não haja abertura para permitir interrupção.

Uma poucas categorias de disfluências de fala:

Fillers - palavras ou sílabas inseridas na fala como "er", "um", "like", "well", "so" e "uh". Os preenchimentos não acrescentam ao significado do que está sendo dito, mas são muito comuns na fala humana - de acordo com algumas estimativas, os preenchimentos compõem até 20 por cento da linguagem falada.

Hesitações - É menos comum para um falante simplesmente pausar do que inserir um preenchimento, mas os padrões de fala das pessoas raramente são regulares.

Palavras, sílabas ou sons repetidos - A gagueira é um exemplo disso, em que os falantes tendem a ficar pendurados no som inicial de uma palavra, repetem-na vezes sem conta e têm dificuldade em ultrapassá-la.

Repairs - Os falantes podem, por exemplo, pronunciar mal uma palavra e repeti-la com a pronúncia correta antes de avançar.

False starts - Os falantes às vezes interrompem suas próprias frases, começando um novo assunto antes de terminar o pensamento original.

Prolongações - Podem ser usadas para dar mais tempo ao orador para formular o resto de uma frase ou podem ser usadas simplesmente para o efeito, como em: "Aaaaaaaaaaannnnnd... Eu ganho!"

Blocks - Neste caso, as pessoas não conseguem produzir a palavra que querem.

A maioria das pessoas usa frequentemente disfluências da fala e também as faz acontecer inadvertidamente. Tecnologias de IA como linguagem natural processing (NLP) sistemas requerem treinamento em disfluencies. Em aplicações de IA relacionadas à voz, disfluências podem ser adicionadas para fazer a fala parecer mais humana. Assistentes recentes de IA, por exemplo, começaram a adotar disfluências para soar mais natural para as pessoas com quem interagem. Hesitações e palavras de preenchimento, em particular, são empregadas para fazer a IA soar menos robótica.