Overfitting

Overfitting é a otimização incorreta de um modelo de inteligência artificial (IA), onde a busca de precisão vai longe demais e pode resultar em falsos positivos.

Overfitting contrasta com underfitting, o que também pode resultar em imprecisões. O sobreajustamento é frequentemente referido como sobretreinamento e o subajustamento como subtreinamento. Overfitting e underfitting tanto arruinam a precisão de um modelo ao levar a observações de tendências e  previsões que não seguem a realidade dos dados.

False positives from overfitting can cause problems with the predictions and assertions made by AI. O subajuste, por outro lado, pode falhar dados que devem ser incluídos devido a omissões resultantes de um modelo super específico. Em dados não vistos, um modelo de sobreajuste cometerá erros que refletem aqueles em seus dados de treinamento. Esta imprecisão é frequentemente o resultado do modelo começar a tentar memorizar resultados em vez de prever com precisão dados anteriormente não vistos.

Por exemplo, uma caça à IA é para o número 1 em data. Dependendo da clareza da caligrafia, um falso positivo pode estar agrupando cerca de 7s como 1s, o que seria um overfit. Inversamente, uma omissão que poderia resultar no não reconhecimento de 1s em alguns estilos de caligrafia, o que seria um subfit.

Overfitting pode ser o resultado de sobretreinamento, falta de validação, validação inadequada ou ajuste de pesos e tentativas de otimização após o teste final. O overfitting também pode ser o resultado do uso de dados de treinamento muito ruidosos, contendo informações inadequadas.