A) Zbadanie związku między zmiennymi. B) Do obliczania średnich danych liczbowych. C) Podsumowanie danych kategorycznych. D) Tworzenie wizualnych reprezentacji danych.
A) Jak dobrze model pasuje do obserwowanych danych. B) Rozmiar zbioru danych. C) Liczba zmiennych w modelu. D) Rodzaj zastosowanego testu statystycznego.
A) Liniowość B) Niezależność obserwacji C) Homoscedastyczność D) Rozkład normalny reszt
A) Analiza regresji B) Walidacja krzyżowa C) Test chi-kwadrat D) Analiza składowych głównych
A) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu. B) Dokładne dopasowanie modelu do danych treningowych. C) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej. D) Automatyzacja całego procesu modelowania.
A) Grupowanie podobnych punktów danych na podstawie wzorców lub cech. B) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych. C) Badanie związków przyczynowo-skutkowych. D) Wykreślanie punktów danych w przestrzeni dwuwymiarowej.
A) Gdy model jest zbyt złożony i wychwytuje szum w danych. B) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane. C) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych. D) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej.
A) Ocena wydajności modelu klasyfikacji. B) Testowanie założenia liniowości w modelach regresji. C) Ocena dobroci dopasowania w regresji logistycznej. D) Aby podsumować dystrybucję zbioru danych.
A) PCA B) ANOVA C) Drzewo decyzyjne D) Regresja logistyczna |