A) Untuk menghitung rata-rata data numerik. B) Untuk meringkas data kategorikal. C) Untuk membuat representasi visual dari data. D) Untuk menguji hubungan antara variabel.
A) Ukuran dari kumpulan data. B) Jenis uji statistik yang digunakan. C) Jumlah variabel dalam model. D) Seberapa baik model tersebut sesuai dengan data yang diamati.
A) Distribusi normal dari residu B) Independensi antar observasi C) Linearitas D) Homoskedastisitas
A) Uji chi-kuadrat B) Analisis regresi C) Analisis komponen utama D) Validasi silang (cross-validation)
A) Untuk membuat grafik titik data dalam ruang dua dimensi. B) Untuk menyelidiki hubungan sebab-akibat. C) Untuk mengelompokkan titik data yang serupa berdasarkan pola atau fitur. D) Untuk menciptakan satu ukuran komposit dari beberapa variabel.
A) Untuk mengevaluasi kinerja model klasifikasi. B) Untuk menilai seberapa baik model sesuai dengan data dalam regresi logistik. C) Untuk menguji asumsi linearitas dalam model regresi. D) Untuk meringkas distribusi suatu dataset.
A) Untuk membuat variabel input baru dari data yang ada guna meningkatkan kinerja model. B) Untuk mengotomatiskan seluruh proses pemodelan. C) Untuk menyesuaikan model secara tepat dengan data pelatihan. D) Untuk menghilangkan semua variabel input kecuali yang paling penting.
A) Regresi logistik B) Pohon keputusan C) ANOVA (Analisis Varians) D) PCA (Principal Component Analysis/Analisis Komponen Utama)
A) Ketika sebuah model terlalu sederhana dan kurang memiliki kemampuan prediktif. B) Ketika sebuah model terlalu kompleks dan menangkap 'noise' (gangguan) dalam data. C) Ketika sebuah model sangat cocok dengan data pelatihan, tetapi gagal memberikan hasil yang baik pada data baru. D) Ketika sebuah model memiliki tingkat kompleksitas yang tepat dan dapat memberikan generalisasi yang baik pada data yang belum pernah dilihat sebelumnya. |