A) Podsumowanie danych kategorycznych. B) Do obliczania średnich danych liczbowych. C) Zbadanie związku między zmiennymi. D) Tworzenie wizualnych reprezentacji danych.
A) Rodzaj zastosowanego testu statystycznego. B) Liczba zmiennych w modelu. C) Jak dobrze model pasuje do obserwowanych danych. D) Rozmiar zbioru danych.
A) Rozkład normalny reszt B) Niezależność obserwacji C) Liniowość D) Homoscedastyczność
A) Regresja logistyczna B) Drzewo decyzyjne C) PCA D) ANOVA
A) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych. B) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej. C) Gdy model jest zbyt złożony i wychwytuje szum w danych. D) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane.
A) Wykreślanie punktów danych w przestrzeni dwuwymiarowej. B) Badanie związków przyczynowo-skutkowych. C) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych. D) Grupowanie podobnych punktów danych na podstawie wzorców lub cech.
A) Automatyzacja całego procesu modelowania. B) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej. C) Dokładne dopasowanie modelu do danych treningowych. D) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu.
A) Ocena dobroci dopasowania w regresji logistycznej. B) Testowanie założenia liniowości w modelach regresji. C) Aby podsumować dystrybucję zbioru danych. D) Ocena wydajności modelu klasyfikacji.
A) Analiza składowych głównych B) Analiza regresji C) Walidacja krzyżowa D) Test chi-kwadrat |