A) Pour calculer des moyennes de données numériques. B) Examiner la relation entre les variables. C) Créer des représentations visuelles des données. D) Pour résumer des données catégorielles.
A) La taille de l'ensemble de données. B) Le nombre de variables dans le modèle. C) Le degré d'adéquation du modèle avec les données observées. D) Le type de test statistique utilisé.
A) Homoscédasticité B) Indépendance des observations C) Distribution normale des résidus D) Linéarité
A) Régression logistique B) ANOVA C) Arbre de décision D) APC
A) Étudier les relations de cause à effet. B) Regrouper des points de données similaires sur la base de modèles ou de caractéristiques. C) Tracer des points de données dans un espace bidimensionnel. D) Pour créer une mesure composite unique à partir de plusieurs variables.
A) Évaluer la qualité de l'ajustement de la régression logistique. B) Évaluer la performance d'un modèle de classification. C) Tester l'hypothèse de linéarité dans les modèles de régression. D) Pour résumer la distribution d'un ensemble de données.
A) Analyse en composantes principales B) Validation croisée C) Analyse de régression D) Test du chi carré
A) Lorsqu'un modèle est trop complexe et qu'il capture du bruit dans les données. B) Lorsqu'un modèle est juste et qu'il se généralise bien à des données inédites. C) Lorsqu'un modèle s'adapte parfaitement aux données d'apprentissage mais échoue sur de nouvelles données. D) Lorsqu'un modèle est trop simple et manque de puissance prédictive.
A) Créer de nouvelles variables d'entrée à partir de données existantes afin d'améliorer les performances du modèle. B) Pour ajuster le modèle exactement aux données d'apprentissage. C) Automatiser l'ensemble du processus de modélisation. D) Pour supprimer toutes les variables d'entrée à l'exception de la plus importante. |