A) Zbadanie związku między zmiennymi. B) Tworzenie wizualnych reprezentacji danych. C) Do obliczania średnich danych liczbowych. D) Podsumowanie danych kategorycznych.
A) Jak dobrze model pasuje do obserwowanych danych. B) Rozmiar zbioru danych. C) Rodzaj zastosowanego testu statystycznego. D) Liczba zmiennych w modelu.
A) Rozkład normalny reszt B) Liniowość C) Homoscedastyczność D) Niezależność obserwacji
A) Test chi-kwadrat B) Analiza regresji C) Analiza składowych głównych D) Walidacja krzyżowa
A) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej. B) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu. C) Automatyzacja całego procesu modelowania. D) Dokładne dopasowanie modelu do danych treningowych.
A) Badanie związków przyczynowo-skutkowych. B) Grupowanie podobnych punktów danych na podstawie wzorców lub cech. C) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych. D) Wykreślanie punktów danych w przestrzeni dwuwymiarowej.
A) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane. B) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych. C) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej. D) Gdy model jest zbyt złożony i wychwytuje szum w danych.
A) Ocena dobroci dopasowania w regresji logistycznej. B) Aby podsumować dystrybucję zbioru danych. C) Testowanie założenia liniowości w modelach regresji. D) Ocena wydajności modelu klasyfikacji.
A) PCA B) Drzewo decyzyjne C) ANOVA D) Regresja logistyczna |