A) Povzetek kategoričnih podatkov. B) Preučitev razmerja med spremenljivkami. C) ustvarjanje vizualnih predstavitev podatkov. D) Izračunavanje povprečij številčnih podatkov.
A) Velikost nabora podatkov. B) Število spremenljivk v modelu. C) Vrsta uporabljenega statističnega testa. D) Kako dobro se model ujema z opazovanimi podatki.
A) Normalna porazdelitev ostankov B) Neodvisnost opazovanj C) Linearnost D) Homoskedastičnost
A) Kadar se model popolnoma prilega podatkom za usposabljanje, vendar je neuspešen pri novih podatkih. B) Ko je model ravno pravšnji in se dobro posplošuje na nepoznane podatke. C) Kadar je model preveč preprost in nima zadostne napovedne moči. D) Kadar je model preveč zapleten in zajame šum v podatkih.
A) Drevo odločanja B) ANOVA C) PCA D) Logistična regresija
A) Natančno prileganje modela podatkom za učenje. B) Za avtomatizacijo celotnega postopka modeliranja. C) Odstranitev vseh vhodnih spremenljivk razen najpomembnejše. D) ustvarjanje novih vhodnih spremenljivk iz obstoječih podatkov za izboljšanje delovanja modela.
A) Ocenjevanje uspešnosti klasifikacijskega modela. B) Povzetek porazdelitve nabora podatkov. C) Oceniti ustreznost logistične regresije. D) Preverjanje predpostavke o linearnosti v regresijskih modelih.
A) Analiza glavnih komponent B) Test Chi-kvadrat C) Regresijska analiza D) Navzkrižno preverjanje
A) Ustvarjanje enega sestavljenega merila iz več spremenljivk. B) Združevanje podobnih podatkovnih točk na podlagi vzorcev ali značilnosti. C) Raziskovanje vzročno-posledičnih povezav. D) Izris podatkovnih točk v dvodimenzionalnem prostoru. |