A) Tworzenie wizualnych reprezentacji danych. B) Do obliczania średnich danych liczbowych. C) Podsumowanie danych kategorycznych. D) Zbadanie związku między zmiennymi.
A) Jak dobrze model pasuje do obserwowanych danych. B) Rodzaj zastosowanego testu statystycznego. C) Rozmiar zbioru danych. D) Liczba zmiennych w modelu.
A) Homoscedastyczność B) Niezależność obserwacji C) Rozkład normalny reszt D) Liniowość
A) Walidacja krzyżowa B) Analiza składowych głównych C) Analiza regresji D) Test chi-kwadrat
A) Dokładne dopasowanie modelu do danych treningowych. B) Automatyzacja całego procesu modelowania. C) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej. D) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu.
A) Wykreślanie punktów danych w przestrzeni dwuwymiarowej. B) Badanie związków przyczynowo-skutkowych. C) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych. D) Grupowanie podobnych punktów danych na podstawie wzorców lub cech.
A) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych. B) Gdy model jest zbyt złożony i wychwytuje szum w danych. C) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane. D) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej.
A) Ocena wydajności modelu klasyfikacji. B) Aby podsumować dystrybucję zbioru danych. C) Ocena dobroci dopasowania w regresji logistycznej. D) Testowanie założenia liniowości w modelach regresji.
A) PCA B) ANOVA C) Drzewo decyzyjne D) Regresja logistyczna |