A) Creare rappresentazioni visive dei dati. B) Riassumere i dati categorici. C) Esaminare la relazione tra le variabili. D) Per calcolare le medie dei dati numerici.
A) Il tipo di test statistico utilizzato. B) Il numero di variabili nel modello. C) Quanto il modello si adatta ai dati osservati. D) La dimensione del set di dati.
A) Indipendenza delle osservazioni B) Omoscedasticità C) Distribuzione normale dei residui D) Linearità
A) Quando un modello è giusto e si generalizza bene a dati non visti. B) Quando un modello è troppo complesso e cattura il rumore nei dati. C) Quando un modello si adatta perfettamente ai dati di addestramento ma fallisce sui nuovi dati. D) Quando un modello è troppo semplice e manca di potere predittivo.
A) Regressione logistica B) ANOVA C) Albero decisionale D) PCA
A) Per creare una singola misura composita da più variabili. B) Raggruppare punti di dati simili in base a modelli o caratteristiche. C) Tracciare punti di dati in uno spazio bidimensionale. D) Indagare le relazioni di causa-effetto.
A) Convalida incrociata B) Analisi di regressione C) Test chi-quadro D) Analisi delle componenti principali
A) Per rimuovere tutte le variabili di input tranne quella più importante. B) Per automatizzare l'intero processo di modellazione. C) Creare nuove variabili di input dai dati esistenti per migliorare le prestazioni del modello. D) Per adattare il modello esattamente ai dati di addestramento.
A) Per verificare l'ipotesi di linearità nei modelli di regressione. B) Per riassumere la distribuzione di un set di dati. C) Valutare le prestazioni di un modello di classificazione. D) Valutare la bontà dell'adattamento nella regressione logistica. |