A) ustvarjanje vizualnih predstavitev podatkov. B) Povzetek kategoričnih podatkov. C) Izračunavanje povprečij številčnih podatkov. D) Preučitev razmerja med spremenljivkami.
A) Število spremenljivk v modelu. B) Kako dobro se model ujema z opazovanimi podatki. C) Vrsta uporabljenega statističnega testa. D) Velikost nabora podatkov.
A) Homoskedastičnost B) Linearnost C) Normalna porazdelitev ostankov D) Neodvisnost opazovanj
A) Za avtomatizacijo celotnega postopka modeliranja. B) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše. C) Natančno prileganje modela podatkom za učenje. D) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela.
A) Ustvarjanje enega sestavljenega merila iz več spremenljivk. B) Izris podatkovnih točk v dvodimenzionalnem prostoru. C) Raziskovanje vzročno-posledičnih povezav. D) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti.
A) Regresijska analiza B) Navzkrižno preverjanje C) Analiza glavnih komponent D) Test Chi-kvadrat
A) Kadar je model preveč zapleten in zajame šum v podatkih. B) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih. C) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke. D) Kadar je model preveč preprost in nima zadostne napovedne moči.
A) Oceniti ustreznost logistične regresije. B) Preverjanje predpostavke o linearnosti v regresijskih modelih. C) Povzetek porazdelitve nabora podatkov. D) Ocenjevanje uspešnosti klasifikacijskega modela.
A) Drevo odločanja B) Logistična regresija C) PCA D) ANOVA |