A) Examiner la relation entre les variables. B) Créer des représentations visuelles des données. C) Pour résumer des données catégorielles. D) Pour calculer des moyennes de données numériques.
A) Le nombre de variables dans le modèle. B) Le degré d'adéquation du modèle avec les données observées. C) Le type de test statistique utilisé. D) La taille de l'ensemble de données.
A) Distribution normale des résidus B) Homoscédasticité C) Indépendance des observations D) Linéarité
A) Lorsqu'un modèle est trop complexe et qu'il capture du bruit dans les données. B) Lorsqu'un modèle est trop simple et manque de puissance prédictive. C) Lorsqu'un modèle est juste et qu'il se généralise bien à des données inédites. D) Lorsqu'un modèle s'adapte parfaitement aux données d'apprentissage mais échoue sur de nouvelles données.
A) Régression logistique B) ANOVA C) Arbre de décision D) APC
A) Pour créer une mesure composite unique à partir de plusieurs variables. B) Étudier les relations de cause à effet. C) Regrouper des points de données similaires sur la base de modèles ou de caractéristiques. D) Tracer des points de données dans un espace bidimensionnel.
A) Analyse en composantes principales B) Test du chi carré C) Analyse de régression D) Validation croisée
A) Pour ajuster le modèle exactement aux données d'apprentissage. B) Créer de nouvelles variables d'entrée à partir de données existantes afin d'améliorer les performances du modèle. C) Pour supprimer toutes les variables d'entrée à l'exception de la plus importante. D) Automatiser l'ensemble du processus de modélisation.
A) Évaluer la performance d'un modèle de classification. B) Évaluer la qualité de l'ajustement de la régression logistique. C) Pour résumer la distribution d'un ensemble de données. D) Tester l'hypothèse de linéarité dans les modèles de régression. |