A) Preučitev razmerja med spremenljivkami. B) Izračunavanje povprečij številčnih podatkov. C) Povzetek kategoričnih podatkov. D) ustvarjanje vizualnih predstavitev podatkov.
A) Velikost nabora podatkov. B) Vrsta uporabljenega statističnega testa. C) Število spremenljivk v modelu. D) Kako dobro se model ujema z opazovanimi podatki.
A) Neodvisnost opazovanj B) Homoskedastičnost C) Linearnost D) Normalna porazdelitev ostankov
A) Kadar je model preveč zapleten in zajame šum v podatkih. B) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke. C) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih. D) Kadar je model preveč preprost in nima zadostne napovedne moči.
A) Drevo odločanja B) PCA C) Logistična regresija D) ANOVA
A) Natančno prileganje modela podatkom za učenje. B) Za avtomatizacijo celotnega postopka modeliranja. C) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše. D) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela.
A) Oceniti ustreznost logistične regresije. B) Povzetek porazdelitve nabora podatkov. C) Ocenjevanje uspešnosti klasifikacijskega modela. D) Preverjanje predpostavke o linearnosti v regresijskih modelih.
A) Navzkrižno preverjanje B) Analiza glavnih komponent C) Test Chi-kvadrat D) Regresijska analiza
A) Izris podatkovnih točk v dvodimenzionalnem prostoru. B) Ustvarjanje enega sestavljenega merila iz več spremenljivk. C) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti. D) Raziskovanje vzročno-posledičnih povezav. |