A) Para criar representações visuais de dados. B) Para resumir dados categóricos. C) Examinar a relação entre as variáveis. D) Para calcular médias de dados numéricos.
A) O tipo de teste estatístico utilizado. B) O grau de adequação do modelo aos dados observados. C) O tamanho do conjunto de dados. D) O número de variáveis no modelo.
A) Linearidade B) Distribuição normal dos resíduos C) Independência das observações D) Homoscedasticidade
A) ANOVA B) Regressão logística C) APC D) Árvore de decisão
A) Para remover todas as variáveis de entrada, exceto a mais importante. B) Criar novas variáveis de entrada a partir de dados existentes para melhorar o desempenho do modelo. C) Para ajustar o modelo exatamente aos dados de treino. D) Para automatizar todo o processo de modelação.
A) Para resumir a distribuição de um conjunto de dados. B) Avaliar a bondade do ajuste na regressão logística. C) Para testar o pressuposto de linearidade em modelos de regressão. D) Para avaliar o desempenho de um modelo de classificação.
A) Teste do qui-quadrado B) Análise de regressão C) Análise de componentes principais D) Validação cruzada
A) Investigar relações de causa e efeito. B) Para traçar pontos de dados num espaço bidimensional. C) Para criar uma única medida composta a partir de múltiplas variáveis. D) Agrupar pontos de dados semelhantes com base em padrões ou caraterísticas.
A) Quando um modelo é demasiado complexo e capta o ruído nos dados. B) Quando um modelo é demasiado simples e não tem capacidade de previsão. C) Quando um modelo se ajusta perfeitamente aos dados de treino mas falha nos novos dados. D) Quando um modelo é correto e generaliza bem para dados não vistos. |