A) Para calcular médias de dados numéricos. B) Examinar a relação entre as variáveis. C) Para resumir dados categóricos. D) Para criar representações visuais de dados.
A) O tipo de teste estatístico utilizado. B) O grau de adequação do modelo aos dados observados. C) O número de variáveis no modelo. D) O tamanho do conjunto de dados.
A) Independência das observações B) Homoscedasticidade C) Linearidade D) Distribuição normal dos resíduos
A) ANOVA B) Árvore de decisão C) APC D) Regressão logística
A) Para testar o pressuposto de linearidade em modelos de regressão. B) Para resumir a distribuição de um conjunto de dados. C) Para avaliar o desempenho de um modelo de classificação. D) Avaliar a bondade do ajuste na regressão logística.
A) Criar novas variáveis de entrada a partir de dados existentes para melhorar o desempenho do modelo. B) Para remover todas as variáveis de entrada, exceto a mais importante. C) Para automatizar todo o processo de modelação. D) Para ajustar o modelo exatamente aos dados de treino.
A) Análise de componentes principais B) Teste do qui-quadrado C) Validação cruzada D) Análise de regressão
A) Quando um modelo é correto e generaliza bem para dados não vistos. B) Quando um modelo é demasiado complexo e capta o ruído nos dados. C) Quando um modelo se ajusta perfeitamente aos dados de treino mas falha nos novos dados. D) Quando um modelo é demasiado simples e não tem capacidade de previsão.
A) Para traçar pontos de dados num espaço bidimensional. B) Agrupar pontos de dados semelhantes com base em padrões ou caraterísticas. C) Investigar relações de causa e efeito. D) Para criar uma única medida composta a partir de múltiplas variáveis. |