A) Do obliczania średnich danych liczbowych. B) Zbadanie związku między zmiennymi. C) Tworzenie wizualnych reprezentacji danych. D) Podsumowanie danych kategorycznych.
A) Rozmiar zbioru danych. B) Rodzaj zastosowanego testu statystycznego. C) Liczba zmiennych w modelu. D) Jak dobrze model pasuje do obserwowanych danych.
A) Homoscedastyczność B) Liniowość C) Niezależność obserwacji D) Rozkład normalny reszt
A) Analiza składowych głównych B) Analiza regresji C) Walidacja krzyżowa D) Test chi-kwadrat
A) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej. B) Automatyzacja całego procesu modelowania. C) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu. D) Dokładne dopasowanie modelu do danych treningowych.
A) Badanie związków przyczynowo-skutkowych. B) Grupowanie podobnych punktów danych na podstawie wzorców lub cech. C) Wykreślanie punktów danych w przestrzeni dwuwymiarowej. D) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych.
A) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane. B) Gdy model jest zbyt złożony i wychwytuje szum w danych. C) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych. D) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej.
A) Testowanie założenia liniowości w modelach regresji. B) Ocena dobroci dopasowania w regresji logistycznej. C) Aby podsumować dystrybucję zbioru danych. D) Ocena wydajności modelu klasyfikacji.
A) ANOVA B) Regresja logistyczna C) PCA D) Drzewo decyzyjne |