A) Untuk menguji hubungan antara variabel. B) Untuk membuat representasi visual dari data. C) Untuk menghitung rata-rata data numerik. D) Untuk meringkas data kategorikal.
A) Jumlah variabel dalam model. B) Ukuran dari kumpulan data. C) Jenis uji statistik yang digunakan. D) Seberapa baik model tersebut sesuai dengan data yang diamati.
A) Independensi antar observasi B) Homoskedastisitas C) Linearitas D) Distribusi normal dari residu
A) Analisis komponen utama B) Uji chi-kuadrat C) Analisis regresi D) Validasi silang (cross-validation)
A) Untuk membuat grafik titik data dalam ruang dua dimensi. B) Untuk mengelompokkan titik data yang serupa berdasarkan pola atau fitur. C) Untuk menyelidiki hubungan sebab-akibat. D) Untuk menciptakan satu ukuran komposit dari beberapa variabel.
A) Untuk menilai seberapa baik model sesuai dengan data dalam regresi logistik. B) Untuk mengevaluasi kinerja model klasifikasi. C) Untuk menguji asumsi linearitas dalam model regresi. D) Untuk meringkas distribusi suatu dataset.
A) Untuk menyesuaikan model secara tepat dengan data pelatihan. B) Untuk membuat variabel input baru dari data yang ada guna meningkatkan kinerja model. C) Untuk menghilangkan semua variabel input kecuali yang paling penting. D) Untuk mengotomatiskan seluruh proses pemodelan.
A) PCA (Principal Component Analysis/Analisis Komponen Utama) B) ANOVA (Analisis Varians) C) Regresi logistik D) Pohon keputusan
A) Ketika sebuah model terlalu kompleks dan menangkap 'noise' (gangguan) dalam data. B) Ketika sebuah model terlalu sederhana dan kurang memiliki kemampuan prediktif. C) Ketika sebuah model memiliki tingkat kompleksitas yang tepat dan dapat memberikan generalisasi yang baik pada data yang belum pernah dilihat sebelumnya. D) Ketika sebuah model sangat cocok dengan data pelatihan, tetapi gagal memberikan hasil yang baik pada data baru. |