A) ustvarjanje vizualnih predstavitev podatkov. B) Izračunavanje povprečij številčnih podatkov. C) Preučitev razmerja med spremenljivkami. D) Povzetek kategoričnih podatkov.
A) Kako dobro se model ujema z opazovanimi podatki. B) Število spremenljivk v modelu. C) Vrsta uporabljenega statističnega testa. D) Velikost nabora podatkov.
A) Normalna porazdelitev ostankov B) Linearnost C) Neodvisnost opazovanj D) Homoskedastičnost
A) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih. B) Kadar je model preveč zapleten in zajame šum v podatkih. C) Kadar je model preveč preprost in nima zadostne napovedne moči. D) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke.
A) Logistična regresija B) PCA C) ANOVA D) Drevo odločanja
A) Natančno prileganje modela podatkom za učenje. B) Za avtomatizacijo celotnega postopka modeliranja. C) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela. D) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše.
A) Ocenjevanje uspešnosti klasifikacijskega modela. B) Oceniti ustreznost logistične regresije. C) Preverjanje predpostavke o linearnosti v regresijskih modelih. D) Povzetek porazdelitve nabora podatkov.
A) Regresijska analiza B) Analiza glavnih komponent C) Navzkrižno preverjanje D) Test Chi-kvadrat
A) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti. B) Raziskovanje vzročno-posledičnih povezav. C) Ustvarjanje enega sestavljenega merila iz več spremenljivk. D) Izris podatkovnih točk v dvodimenzionalnem prostoru. |