A) Podsumowanie danych kategorycznych. B) Do obliczania średnich danych liczbowych. C) Zbadanie związku między zmiennymi. D) Tworzenie wizualnych reprezentacji danych.
A) Liczba zmiennych w modelu. B) Rodzaj zastosowanego testu statystycznego. C) Jak dobrze model pasuje do obserwowanych danych. D) Rozmiar zbioru danych.
A) Liniowość B) Homoscedastyczność C) Rozkład normalny reszt D) Niezależność obserwacji
A) Regresja logistyczna B) PCA C) ANOVA D) Drzewo decyzyjne
A) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych. B) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane. C) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej. D) Gdy model jest zbyt złożony i wychwytuje szum w danych.
A) Wykreślanie punktów danych w przestrzeni dwuwymiarowej. B) Grupowanie podobnych punktów danych na podstawie wzorców lub cech. C) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych. D) Badanie związków przyczynowo-skutkowych.
A) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej. B) Automatyzacja całego procesu modelowania. C) Dokładne dopasowanie modelu do danych treningowych. D) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu.
A) Aby podsumować dystrybucję zbioru danych. B) Ocena wydajności modelu klasyfikacji. C) Testowanie założenia liniowości w modelach regresji. D) Ocena dobroci dopasowania w regresji logistycznej.
A) Test chi-kwadrat B) Analiza składowych głównych C) Analiza regresji D) Walidacja krzyżowa |