A) Examinar a relação entre as variáveis. B) Para resumir dados categóricos. C) Para calcular médias de dados numéricos. D) Para criar representações visuais de dados.
A) O tamanho do conjunto de dados. B) O tipo de teste estatístico utilizado. C) O grau de adequação do modelo aos dados observados. D) O número de variáveis no modelo.
A) Distribuição normal dos resíduos B) Homoscedasticidade C) Independência das observações D) Linearidade
A) Árvore de decisão B) APC C) Regressão logística D) ANOVA
A) Criar novas variáveis de entrada a partir de dados existentes para melhorar o desempenho do modelo. B) Para automatizar todo o processo de modelação. C) Para remover todas as variáveis de entrada, exceto a mais importante. D) Para ajustar o modelo exatamente aos dados de treino.
A) Para testar o pressuposto de linearidade em modelos de regressão. B) Para resumir a distribuição de um conjunto de dados. C) Para avaliar o desempenho de um modelo de classificação. D) Avaliar a bondade do ajuste na regressão logística.
A) Teste do qui-quadrado B) Análise de regressão C) Validação cruzada D) Análise de componentes principais
A) Agrupar pontos de dados semelhantes com base em padrões ou caraterísticas. B) Para criar uma única medida composta a partir de múltiplas variáveis. C) Investigar relações de causa e efeito. D) Para traçar pontos de dados num espaço bidimensional.
A) Quando um modelo é demasiado simples e não tem capacidade de previsão. B) Quando um modelo se ajusta perfeitamente aos dados de treino mas falha nos novos dados. C) Quando um modelo é correto e generaliza bem para dados não vistos. D) Quando um modelo é demasiado complexo e capta o ruído nos dados. |