Banco de dadosBi
- (FUNDATEC 2022)
Durante a etapa do pré-processamento da base de dados, a análise de Outliers é uma tarefa comum e relevante para obter modelos de aprendizado de máquina consistentes. A presença de outliers pode levar a modelos imprecisos quando o modelo é testado ou colocado em produção. Analise as assertivas a seguir e assinale a alternativa correta.
I. Outliers são dados com padrões muito diferentes aos demais, que fogem ao padrão dos dados. Estes dados precisam ser identificados e analisados.
II. Outliers podem ser produzidos por erros de medição, valores default assumidos durante o preenchimento de uma base de dados ou podem corresponder a valores corretos, mas pertencentes a uma base de dados desbalanceada.
III. Na prática, os outliers comumente são eliminados. Porém, pode-se estar negligenciando um conjunto de instâncias que podem trazer novos conhecimentos acerca do domínio de problema.
IV. A detecção de outliers pode ser feita por meio de técnicas univariadas, que consistem em explorar cada atributo e variabilidade dos valores em torno da média. Quando a variabilidade é grande, pode indicar registros, potenciais outliers.
A) Todas estão corretas.
B) Todas estão incorretas.
C) Apenas II e IV estão corretas.
D) Apenas I, II e III estão corretas.
E) Apenas II, III e IV estão corretas.
Próximo:
EXERCÍCIOS - Exercício 93
Vamos para o Anterior: Exercício 91
Tente Este: Exercício 28
Primeiro: Exercício 1
VOLTAR ao índice: Banco de dados