A) Do obliczania średnich danych liczbowych. B) Tworzenie wizualnych reprezentacji danych. C) Zbadanie związku między zmiennymi. D) Podsumowanie danych kategorycznych.
A) Jak dobrze model pasuje do obserwowanych danych. B) Rodzaj zastosowanego testu statystycznego. C) Liczba zmiennych w modelu. D) Rozmiar zbioru danych.
A) Liniowość B) Homoscedastyczność C) Rozkład normalny reszt D) Niezależność obserwacji
A) Analiza regresji B) Test chi-kwadrat C) Analiza składowych głównych D) Walidacja krzyżowa
A) Dokładne dopasowanie modelu do danych treningowych. B) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu. C) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej. D) Automatyzacja całego procesu modelowania.
A) Badanie związków przyczynowo-skutkowych. B) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych. C) Grupowanie podobnych punktów danych na podstawie wzorców lub cech. D) Wykreślanie punktów danych w przestrzeni dwuwymiarowej.
A) Gdy model jest zbyt złożony i wychwytuje szum w danych. B) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane. C) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej. D) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych.
A) Testowanie założenia liniowości w modelach regresji. B) Ocena dobroci dopasowania w regresji logistycznej. C) Aby podsumować dystrybucję zbioru danych. D) Ocena wydajności modelu klasyfikacji.
A) Drzewo decyzyjne B) Regresja logistyczna C) PCA D) ANOVA |