A) Para criar representações visuais de dados. B) Examinar a relação entre as variáveis. C) Para calcular médias de dados numéricos. D) Para resumir dados categóricos.
A) O grau de adequação do modelo aos dados observados. B) O tamanho do conjunto de dados. C) O número de variáveis no modelo. D) O tipo de teste estatístico utilizado.
A) Homoscedasticidade B) Independência das observações C) Linearidade D) Distribuição normal dos resíduos
A) Árvore de decisão B) Regressão logística C) ANOVA D) APC
A) Para resumir a distribuição de um conjunto de dados. B) Para testar o pressuposto de linearidade em modelos de regressão. C) Avaliar a bondade do ajuste na regressão logística. D) Para avaliar o desempenho de um modelo de classificação.
A) Para automatizar todo o processo de modelação. B) Para ajustar o modelo exatamente aos dados de treino. C) Para remover todas as variáveis de entrada, exceto a mais importante. D) Criar novas variáveis de entrada a partir de dados existentes para melhorar o desempenho do modelo.
A) Teste do qui-quadrado B) Validação cruzada C) Análise de regressão D) Análise de componentes principais
A) Quando um modelo é correto e generaliza bem para dados não vistos. B) Quando um modelo é demasiado simples e não tem capacidade de previsão. C) Quando um modelo se ajusta perfeitamente aos dados de treino mas falha nos novos dados. D) Quando um modelo é demasiado complexo e capta o ruído nos dados.
A) Investigar relações de causa e efeito. B) Para criar uma única medida composta a partir de múltiplas variáveis. C) Para traçar pontos de dados num espaço bidimensional. D) Agrupar pontos de dados semelhantes com base em padrões ou caraterísticas. |