A) Creare rappresentazioni visive dei dati. B) Riassumere i dati categorici. C) Per calcolare le medie dei dati numerici. D) Esaminare la relazione tra le variabili.
A) La dimensione del set di dati. B) Il numero di variabili nel modello. C) Il tipo di test statistico utilizzato. D) Quanto il modello si adatta ai dati osservati.
A) Indipendenza delle osservazioni B) Omoscedasticità C) Linearità D) Distribuzione normale dei residui
A) Valutare le prestazioni di un modello di classificazione. B) Per verificare l'ipotesi di linearità nei modelli di regressione. C) Valutare la bontà dell'adattamento nella regressione logistica. D) Per riassumere la distribuzione di un set di dati.
A) Indagare le relazioni di causa-effetto. B) Tracciare punti di dati in uno spazio bidimensionale. C) Per creare una singola misura composita da più variabili. D) Raggruppare punti di dati simili in base a modelli o caratteristiche.
A) Test chi-quadro B) Convalida incrociata C) Analisi delle componenti principali D) Analisi di regressione
A) Quando un modello è giusto e si generalizza bene a dati non visti. B) Quando un modello è troppo semplice e manca di potere predittivo. C) Quando un modello è troppo complesso e cattura il rumore nei dati. D) Quando un modello si adatta perfettamente ai dati di addestramento ma fallisce sui nuovi dati.
A) Regressione logistica B) ANOVA C) PCA D) Albero decisionale
A) Per automatizzare l'intero processo di modellazione. B) Per adattare il modello esattamente ai dati di addestramento. C) Creare nuove variabili di input dai dati esistenti per migliorare le prestazioni del modello. D) Per rimuovere tutte le variabili di input tranne quella più importante. |