A) Povzetek kategoričnih podatkov. B) Preučitev razmerja med spremenljivkami. C) ustvarjanje vizualnih predstavitev podatkov. D) Izračunavanje povprečij številčnih podatkov.
A) Vrsta uporabljenega statističnega testa. B) Velikost nabora podatkov. C) Kako dobro se model ujema z opazovanimi podatki. D) Število spremenljivk v modelu.
A) Normalna porazdelitev ostankov B) Homoskedastičnost C) Neodvisnost opazovanj D) Linearnost
A) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše. B) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela. C) Natančno prileganje modela podatkom za učenje. D) Za avtomatizacijo celotnega postopka modeliranja.
A) Ustvarjanje enega sestavljenega merila iz več spremenljivk. B) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti. C) Raziskovanje vzročno-posledičnih povezav. D) Izris podatkovnih točk v dvodimenzionalnem prostoru.
A) Test Chi-kvadrat B) Analiza glavnih komponent C) Regresijska analiza D) Navzkrižno preverjanje
A) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih. B) Kadar je model preveč zapleten in zajame šum v podatkih. C) Kadar je model preveč preprost in nima zadostne napovedne moči. D) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke.
A) Oceniti ustreznost logistične regresije. B) Preverjanje predpostavke o linearnosti v regresijskih modelih. C) Povzetek porazdelitve nabora podatkov. D) Ocenjevanje uspešnosti klasifikacijskega modela.
A) Logistična regresija B) ANOVA C) Drevo odločanja D) PCA |