A) Preučitev razmerja med spremenljivkami. B) ustvarjanje vizualnih predstavitev podatkov. C) Izračunavanje povprečij številčnih podatkov. D) Povzetek kategoričnih podatkov.
A) Velikost nabora podatkov. B) Vrsta uporabljenega statističnega testa. C) Število spremenljivk v modelu. D) Kako dobro se model ujema z opazovanimi podatki.
A) Normalna porazdelitev ostankov B) Neodvisnost opazovanj C) Linearnost D) Homoskedastičnost
A) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela. B) Natančno prileganje modela podatkom za učenje. C) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše. D) Za avtomatizacijo celotnega postopka modeliranja.
A) Ustvarjanje enega sestavljenega merila iz več spremenljivk. B) Izris podatkovnih točk v dvodimenzionalnem prostoru. C) Raziskovanje vzročno-posledičnih povezav. D) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti.
A) Navzkrižno preverjanje B) Regresijska analiza C) Analiza glavnih komponent D) Test Chi-kvadrat
A) Kadar je model preveč zapleten in zajame šum v podatkih. B) Kadar je model preveč preprost in nima zadostne napovedne moči. C) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke. D) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih.
A) Povzetek porazdelitve nabora podatkov. B) Ocenjevanje uspešnosti klasifikacijskega modela. C) Oceniti ustreznost logistične regresije. D) Preverjanje predpostavke o linearnosti v regresijskih modelih.
A) ANOVA B) PCA C) Drevo odločanja D) Logistična regresija |