A) Pour résumer des données catégorielles. B) Examiner la relation entre les variables. C) Créer des représentations visuelles des données. D) Pour calculer des moyennes de données numériques.
A) Le nombre de variables dans le modèle. B) La taille de l'ensemble de données. C) Le degré d'adéquation du modèle avec les données observées. D) Le type de test statistique utilisé.
A) Linéarité B) Homoscédasticité C) Indépendance des observations D) Distribution normale des résidus
A) Lorsqu'un modèle est trop complexe et qu'il capture du bruit dans les données. B) Lorsqu'un modèle s'adapte parfaitement aux données d'apprentissage mais échoue sur de nouvelles données. C) Lorsqu'un modèle est trop simple et manque de puissance prédictive. D) Lorsqu'un modèle est juste et qu'il se généralise bien à des données inédites.
A) Régression logistique B) Arbre de décision C) ANOVA D) APC
A) Étudier les relations de cause à effet. B) Tracer des points de données dans un espace bidimensionnel. C) Regrouper des points de données similaires sur la base de modèles ou de caractéristiques. D) Pour créer une mesure composite unique à partir de plusieurs variables.
A) Analyse de régression B) Validation croisée C) Test du chi carré D) Analyse en composantes principales
A) Pour supprimer toutes les variables d'entrée à l'exception de la plus importante. B) Pour ajuster le modèle exactement aux données d'apprentissage. C) Créer de nouvelles variables d'entrée à partir de données existantes afin d'améliorer les performances du modèle. D) Automatiser l'ensemble du processus de modélisation.
A) Évaluer la qualité de l'ajustement de la régression logistique. B) Pour résumer la distribution d'un ensemble de données. C) Tester l'hypothèse de linéarité dans les modèles de régression. D) Évaluer la performance d'un modèle de classification. |