A) Do obliczania średnich danych liczbowych. B) Zbadanie związku między zmiennymi. C) Podsumowanie danych kategorycznych. D) Tworzenie wizualnych reprezentacji danych.
A) Liczba zmiennych w modelu. B) Rozmiar zbioru danych. C) Jak dobrze model pasuje do obserwowanych danych. D) Rodzaj zastosowanego testu statystycznego.
A) Rozkład normalny reszt B) Homoscedastyczność C) Liniowość D) Niezależność obserwacji
A) ANOVA B) PCA C) Drzewo decyzyjne D) Regresja logistyczna
A) Gdy model jest zbyt złożony i wychwytuje szum w danych. B) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych. C) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane. D) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej.
A) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych. B) Grupowanie podobnych punktów danych na podstawie wzorców lub cech. C) Wykreślanie punktów danych w przestrzeni dwuwymiarowej. D) Badanie związków przyczynowo-skutkowych.
A) Automatyzacja całego procesu modelowania. B) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu. C) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej. D) Dokładne dopasowanie modelu do danych treningowych.
A) Aby podsumować dystrybucję zbioru danych. B) Testowanie założenia liniowości w modelach regresji. C) Ocena dobroci dopasowania w regresji logistycznej. D) Ocena wydajności modelu klasyfikacji.
A) Analiza regresji B) Walidacja krzyżowa C) Test chi-kwadrat D) Analiza składowych głównych |