A) Tworzenie wizualnych reprezentacji danych. B) Do obliczania średnich danych liczbowych. C) Podsumowanie danych kategorycznych. D) Zbadanie związku między zmiennymi.
A) Rodzaj zastosowanego testu statystycznego. B) Liczba zmiennych w modelu. C) Jak dobrze model pasuje do obserwowanych danych. D) Rozmiar zbioru danych.
A) Homoscedastyczność B) Liniowość C) Rozkład normalny reszt D) Niezależność obserwacji
A) Analiza składowych głównych B) Analiza regresji C) Walidacja krzyżowa D) Test chi-kwadrat
A) Tworzenie nowych zmiennych wejściowych z istniejących danych w celu poprawy wydajności modelu. B) Aby usunąć wszystkie zmienne wejściowe z wyjątkiem najważniejszej. C) Dokładne dopasowanie modelu do danych treningowych. D) Automatyzacja całego procesu modelowania.
A) Wykreślanie punktów danych w przestrzeni dwuwymiarowej. B) Badanie związków przyczynowo-skutkowych. C) Aby utworzyć pojedynczą miarę złożoną z wielu zmiennych. D) Grupowanie podobnych punktów danych na podstawie wzorców lub cech.
A) Gdy model jest zbyt złożony i wychwytuje szum w danych. B) Gdy model jest zbyt prosty i brakuje mu mocy predykcyjnej. C) Gdy model jest odpowiedni i dobrze uogólnia się na niewidoczne dane. D) Gdy model idealnie pasuje do danych treningowych, ale zawodzi na nowych danych.
A) Testowanie założenia liniowości w modelach regresji. B) Ocena wydajności modelu klasyfikacji. C) Aby podsumować dystrybucję zbioru danych. D) Ocena dobroci dopasowania w regresji logistycznej.
A) Drzewo decyzyjne B) ANOVA C) PCA D) Regresja logistyczna |