Uma disfluência da fala é qualquer perturbação no fluxo da linguagem falada que é causada pelo falante. Os tipos de disfluências de fala incluem gagueira e hesitações, assim como os preenchimentos que as pessoas inserem para evitar pausas estranhas enquanto encontram suas próximas palavras e talvez garantir que não haja abertura para permitir interrupção.
Uma poucas categorias de disfluências de fala:
Fillers - palavras ou sílabas inseridas na fala como "er", "um", "like", "well", "so" e "uh". Os preenchimentos não acrescentam ao significado do que está sendo dito, mas são muito comuns na fala humana - de acordo com algumas estimativas, os preenchimentos compõem até 20 por cento da linguagem falada.
Hesitações - É menos comum para um falante simplesmente pausar do que inserir um preenchimento, mas os padrões de fala das pessoas raramente são regulares.
Palavras, sílabas ou sons repetidos - A gagueira é um exemplo disso, em que os falantes tendem a ficar pendurados no som inicial de uma palavra, repetem-na vezes sem conta e têm dificuldade em ultrapassá-la.
Repairs - Os falantes podem, por exemplo, pronunciar mal uma palavra e repeti-la com a pronúncia correta antes de avançar.
False starts - Os falantes às vezes interrompem suas próprias frases, começando um novo assunto antes de terminar o pensamento original.
Prolongações - Podem ser usadas para dar mais tempo ao orador para formular o resto de uma frase ou podem ser usadas simplesmente para o efeito, como em: "Aaaaaaaaaaannnnnd... Eu ganho!"
Blocks - Neste caso, as pessoas não conseguem produzir a palavra que querem.
A maioria das pessoas usa frequentemente disfluências da fala e também as faz acontecer inadvertidamente. Tecnologias de IA como linguagem natural processing (NLP) sistemas requerem treinamento em disfluencies. Em aplicações de IA relacionadas à voz, disfluências podem ser adicionadas para fazer a fala parecer mais humana. Assistentes recentes de IA, por exemplo, começaram a adotar disfluências para soar mais natural para as pessoas com quem interagem. Hesitações e palavras de preenchimento, em particular, são empregadas para fazer a IA soar menos robótica.