A) ustvarjanje vizualnih predstavitev podatkov. B) Preučitev razmerja med spremenljivkami. C) Izračunavanje povprečij številčnih podatkov. D) Povzetek kategoričnih podatkov.
A) Velikost nabora podatkov. B) Kako dobro se model ujema z opazovanimi podatki. C) Število spremenljivk v modelu. D) Vrsta uporabljenega statističnega testa.
A) Neodvisnost opazovanj B) Normalna porazdelitev ostankov C) Linearnost D) Homoskedastičnost
A) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih. B) Kadar je model preveč zapleten in zajame šum v podatkih. C) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke. D) Kadar je model preveč preprost in nima zadostne napovedne moči.
A) PCA B) Logistična regresija C) Drevo odločanja D) ANOVA
A) Za avtomatizacijo celotnega postopka modeliranja. B) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše. C) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela. D) Natančno prileganje modela podatkom za učenje.
A) Oceniti ustreznost logistične regresije. B) Ocenjevanje uspešnosti klasifikacijskega modela. C) Povzetek porazdelitve nabora podatkov. D) Preverjanje predpostavke o linearnosti v regresijskih modelih.
A) Test Chi-kvadrat B) Navzkrižno preverjanje C) Analiza glavnih komponent D) Regresijska analiza
A) Raziskovanje vzročno-posledičnih povezav. B) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti. C) Ustvarjanje enega sestavljenega merila iz več spremenljivk. D) Izris podatkovnih točk v dvodimenzionalnem prostoru. |