A) Créer des représentations visuelles des données. B) Examiner la relation entre les variables. C) Pour résumer des données catégorielles. D) Pour calculer des moyennes de données numériques.
A) La taille de l'ensemble de données. B) Le degré d'adéquation du modèle avec les données observées. C) Le nombre de variables dans le modèle. D) Le type de test statistique utilisé.
A) Distribution normale des résidus B) Linéarité C) Indépendance des observations D) Homoscédasticité
A) Arbre de décision B) Régression logistique C) ANOVA D) APC
A) Étudier les relations de cause à effet. B) Pour créer une mesure composite unique à partir de plusieurs variables. C) Tracer des points de données dans un espace bidimensionnel. D) Regrouper des points de données similaires sur la base de modèles ou de caractéristiques.
A) Évaluer la qualité de l'ajustement de la régression logistique. B) Pour résumer la distribution d'un ensemble de données. C) Évaluer la performance d'un modèle de classification. D) Tester l'hypothèse de linéarité dans les modèles de régression.
A) Analyse en composantes principales B) Test du chi carré C) Analyse de régression D) Validation croisée
A) Lorsqu'un modèle s'adapte parfaitement aux données d'apprentissage mais échoue sur de nouvelles données. B) Lorsqu'un modèle est trop simple et manque de puissance prédictive. C) Lorsqu'un modèle est trop complexe et qu'il capture du bruit dans les données. D) Lorsqu'un modèle est juste et qu'il se généralise bien à des données inédites.
A) Pour supprimer toutes les variables d'entrée à l'exception de la plus importante. B) Pour ajuster le modèle exactement aux données d'apprentissage. C) Automatiser l'ensemble du processus de modélisation. D) Créer de nouvelles variables d'entrée à partir de données existantes afin d'améliorer les performances du modèle. |