A) Створювати візуальні представлення даних. B) Підсумувати категоріальні дані. C) Обчислювати середні значення числових даних. D) Дослідити взаємозв'язок між змінними.
A) Розмір набору даних. B) Кількість змінних у моделі. C) Наскільки добре модель відповідає спостережуваним даним. D) Тип використаного статистичного тесту.
A) Лінійність B) Нормальний розподіл залишків C) Незалежність спостережень D) Гомоскедастичність
A) Коли модель занадто складна і вносить шум у дані. B) Коли модель є правильною і добре узагальнює невидимі дані. C) Коли модель ідеально підходить для навчальних даних, але дає збій на нових даних. D) Коли модель занадто проста і не має достатньої прогностичної сили.
A) PCA B) Логістична регресія C) Дерево рішень D) ANOVA
A) Дослідити причинно-наслідкові зв'язки. B) Побудувати графік точок даних у двовимірному просторі. C) Групування схожих даних на основі шаблонів або ознак. D) Створити єдиний складений показник з декількох змінних.
A) Аналіз головних компонент B) Тест хі-квадрат C) Регресійний аналіз D) Перехресна перевірка
A) Видалити всі вхідні змінні, крім найважливішої. B) Створення нових вхідних змінних на основі існуючих даних для покращення продуктивності моделі. C) Автоматизувати весь процес моделювання. D) Точно підігнати модель під навчальні дані.
A) Перевірка припущення про лінійність у регресійних моделях. B) Оцінити продуктивність моделі класифікації. C) Оцінити відповідність у логістичній регресії. D) Підсумувати розподіл набору даних. |