A) Para criar representações visuais de dados. B) Para calcular médias de dados numéricos. C) Para resumir dados categóricos. D) Examinar a relação entre as variáveis.
A) O número de variáveis no modelo. B) O tamanho do conjunto de dados. C) O tipo de teste estatístico utilizado. D) O grau de adequação do modelo aos dados observados.
A) Linearidade B) Distribuição normal dos resíduos C) Homoscedasticidade D) Independência das observações
A) ANOVA B) Árvore de decisão C) APC D) Regressão logística
A) Criar novas variáveis de entrada a partir de dados existentes para melhorar o desempenho do modelo. B) Para ajustar o modelo exatamente aos dados de treino. C) Para remover todas as variáveis de entrada, exceto a mais importante. D) Para automatizar todo o processo de modelação.
A) Avaliar a bondade do ajuste na regressão logística. B) Para resumir a distribuição de um conjunto de dados. C) Para testar o pressuposto de linearidade em modelos de regressão. D) Para avaliar o desempenho de um modelo de classificação.
A) Análise de componentes principais B) Validação cruzada C) Análise de regressão D) Teste do qui-quadrado
A) Para traçar pontos de dados num espaço bidimensional. B) Para criar uma única medida composta a partir de múltiplas variáveis. C) Investigar relações de causa e efeito. D) Agrupar pontos de dados semelhantes com base em padrões ou caraterísticas.
A) Quando um modelo se ajusta perfeitamente aos dados de treino mas falha nos novos dados. B) Quando um modelo é demasiado simples e não tem capacidade de previsão. C) Quando um modelo é correto e generaliza bem para dados não vistos. D) Quando um modelo é demasiado complexo e capta o ruído nos dados. |