A) Povzetek kategoričnih podatkov. B) Preučitev razmerja med spremenljivkami. C) Izračunavanje povprečij številčnih podatkov. D) ustvarjanje vizualnih predstavitev podatkov.
A) Kako dobro se model ujema z opazovanimi podatki. B) Vrsta uporabljenega statističnega testa. C) Število spremenljivk v modelu. D) Velikost nabora podatkov.
A) Normalna porazdelitev ostankov B) Linearnost C) Homoskedastičnost D) Neodvisnost opazovanj
A) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih. B) Kadar je model preveč preprost in nima zadostne napovedne moči. C) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke. D) Kadar je model preveč zapleten in zajame šum v podatkih.
A) PCA B) Drevo odločanja C) Logistična regresija D) ANOVA
A) Natančno prileganje modela podatkom za učenje. B) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela. C) Za avtomatizacijo celotnega postopka modeliranja. D) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše.
A) Ocenjevanje uspešnosti klasifikacijskega modela. B) Preverjanje predpostavke o linearnosti v regresijskih modelih. C) Povzetek porazdelitve nabora podatkov. D) Oceniti ustreznost logistične regresije.
A) Regresijska analiza B) Navzkrižno preverjanje C) Test Chi-kvadrat D) Analiza glavnih komponent
A) Ustvarjanje enega sestavljenega merila iz več spremenljivk. B) Izris podatkovnih točk v dvodimenzionalnem prostoru. C) Raziskovanje vzročno-posledičnih povezav. D) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti. |