Uma consulta de linguagem natural é um input que consiste apenas em termos ou frases faladas normalmente ou introduzidas como podem ser faladas, sem quaisquer caracteres não linguísticos, tais como o símbolo mais ou o asterisco, e sem qualquer formato especial ou alteração de sintaxe. As consultas em linguagem natural podem ser realizadas através de uma interface de texto ou voz.
O processamento de linguagem natural (PNL) torna possível que o software "compreenda" a fala humana típica ou o conteúdo escrito como entrada e possivelmente responda a ela, dependendo da aplicação. Um assistente virtual, por exemplo, é projetado para responder à entrada de voz ou texto. No entanto, nenhum software é capaz de realmente derivar significado da linguagem humana tal como é falada, por isso a PNL envolve processos para traduzir a linguagem entre os dois.
NLP aplica técnicas de sintaxe como a análise gramatical, segmentação de palavras para dividir o texto em unidades menores, quebra de frases para aplicar limites significativos no texto não quebrado, segmentação morfológica para identificar a estrutura e a forma das palavras e o stemming, reduzindo as palavras às hastes às quais os sufixos e prefixos se ligam. Além desses processos, a PNL usa técnicas incluindo o reconhecimento de entidades nomeadas (NER) e a desambiguação do sentido das palavras para entender as consultas dos usuários de entrada, traduzi-las e devolvê-las como respostas compreensíveis para o ser humano através da geração de linguagem natural (NLG).