A) Creare rappresentazioni visive dei dati. B) Esaminare la relazione tra le variabili. C) Riassumere i dati categorici. D) Per calcolare le medie dei dati numerici.
A) Il tipo di test statistico utilizzato. B) La dimensione del set di dati. C) Quanto il modello si adatta ai dati osservati. D) Il numero di variabili nel modello.
A) Distribuzione normale dei residui B) Omoscedasticità C) Indipendenza delle osservazioni D) Linearità
A) Analisi delle componenti principali B) Test chi-quadro C) Analisi di regressione D) Convalida incrociata
A) Quando un modello è troppo complesso e cattura il rumore nei dati. B) Quando un modello è giusto e si generalizza bene a dati non visti. C) Quando un modello si adatta perfettamente ai dati di addestramento ma fallisce sui nuovi dati. D) Quando un modello è troppo semplice e manca di potere predittivo.
A) Valutare le prestazioni di un modello di classificazione. B) Per riassumere la distribuzione di un set di dati. C) Valutare la bontà dell'adattamento nella regressione logistica. D) Per verificare l'ipotesi di linearità nei modelli di regressione.
A) PCA B) ANOVA C) Albero decisionale D) Regressione logistica
A) Tracciare punti di dati in uno spazio bidimensionale. B) Per creare una singola misura composita da più variabili. C) Indagare le relazioni di causa-effetto. D) Raggruppare punti di dati simili in base a modelli o caratteristiche.
A) Creare nuove variabili di input dai dati esistenti per migliorare le prestazioni del modello. B) Per automatizzare l'intero processo di modellazione. C) Per adattare il modello esattamente ai dati di addestramento. D) Per rimuovere tutte le variabili di input tranne quella più importante. |