A) Zbadanie związku między zmiennymi. B) Podsumowanie danych kategorycznych. C) Tworzenie wizualnych reprezentacji danych. D) Do obliczania średnich danych liczbowych.
A) Rodzaj zastosowanego testu statystycznego. B) Rozmiar zbioru danych. C) Liczba zmiennych w modelu. D) Jak dobrze model pasuje do obserwowanych danych.
A) Homoscedastyczność B) Rozkład normalny reszt C) Liniowość D) Niezależność obserwacji
A) Drzewo decyzyjne B) PCA C) ANOVA D) Regresja logistyczna
A) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej. B) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych. C) Gdy model jest zbyt złożony i wychwytuje szum w danych. D) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane.
A) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych. B) Wykreślanie punktów danych w przestrzeni dwuwymiarowej. C) Grupowanie podobnych punktów danych na podstawie wzorców lub cech. D) Badanie związków przyczynowo-skutkowych.
A) Dokładne dopasowanie modelu do danych treningowych. B) Automatyzacja całego procesu modelowania. C) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu. D) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej.
A) Ocena dobroci dopasowania w regresji logistycznej. B) Testowanie założenia liniowości w modelach regresji. C) Ocena wydajności modelu klasyfikacji. D) Aby podsumować dystrybucję zbioru danych.
A) Analiza regresji B) Analiza składowych głównych C) Walidacja krzyżowa D) Test chi-kwadrat |