A) Povzetek kategoričnih podatkov. B) ustvarjanje vizualnih predstavitev podatkov. C) Preučitev razmerja med spremenljivkami. D) Izračunavanje povprečij številčnih podatkov.
A) Vrsta uporabljenega statističnega testa. B) Število spremenljivk v modelu. C) Kako dobro se model ujema z opazovanimi podatki. D) Velikost nabora podatkov.
A) Linearnost B) Neodvisnost opazovanj C) Normalna porazdelitev ostankov D) Homoskedastičnost
A) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke. B) Kadar je model preveč zapleten in zajame šum v podatkih. C) Kadar je model preveč preprost in nima zadostne napovedne moči. D) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih.
A) Drevo odločanja B) ANOVA C) Logistična regresija D) PCA
A) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela. B) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše. C) Za avtomatizacijo celotnega postopka modeliranja. D) Natančno prileganje modela podatkom za učenje.
A) Preverjanje predpostavke o linearnosti v regresijskih modelih. B) Oceniti ustreznost logistične regresije. C) Ocenjevanje uspešnosti klasifikacijskega modela. D) Povzetek porazdelitve nabora podatkov.
A) Analiza glavnih komponent B) Test Chi-kvadrat C) Regresijska analiza D) Navzkrižno preverjanje
A) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti. B) Izris podatkovnih točk v dvodimenzionalnem prostoru. C) Raziskovanje vzročno-posledičnih povezav. D) Ustvarjanje enega sestavljenega merila iz več spremenljivk. |