A) Untuk menghitung rata-rata data numerik. B) Untuk membuat representasi visual dari data. C) Untuk menguji hubungan antara variabel. D) Untuk meringkas data kategorikal.
A) Jenis uji statistik yang digunakan. B) Jumlah variabel dalam model. C) Seberapa baik model tersebut sesuai dengan data yang diamati. D) Ukuran dari kumpulan data.
A) Distribusi normal dari residu B) Homoskedastisitas C) Independensi antar observasi D) Linearitas
A) Analisis komponen utama B) Validasi silang (cross-validation) C) Uji chi-kuadrat D) Analisis regresi
A) Untuk membuat grafik titik data dalam ruang dua dimensi. B) Untuk menyelidiki hubungan sebab-akibat. C) Untuk menciptakan satu ukuran komposit dari beberapa variabel. D) Untuk mengelompokkan titik data yang serupa berdasarkan pola atau fitur.
A) Untuk mengevaluasi kinerja model klasifikasi. B) Untuk meringkas distribusi suatu dataset. C) Untuk menilai seberapa baik model sesuai dengan data dalam regresi logistik. D) Untuk menguji asumsi linearitas dalam model regresi.
A) Untuk membuat variabel input baru dari data yang ada guna meningkatkan kinerja model. B) Untuk menghilangkan semua variabel input kecuali yang paling penting. C) Untuk mengotomatiskan seluruh proses pemodelan. D) Untuk menyesuaikan model secara tepat dengan data pelatihan.
A) Pohon keputusan B) PCA (Principal Component Analysis/Analisis Komponen Utama) C) Regresi logistik D) ANOVA (Analisis Varians)
A) Ketika sebuah model terlalu sederhana dan kurang memiliki kemampuan prediktif. B) Ketika sebuah model terlalu kompleks dan menangkap 'noise' (gangguan) dalam data. C) Ketika sebuah model memiliki tingkat kompleksitas yang tepat dan dapat memberikan generalisasi yang baik pada data yang belum pernah dilihat sebelumnya. D) Ketika sebuah model sangat cocok dengan data pelatihan, tetapi gagal memberikan hasil yang baik pada data baru. |