A) Підсумувати категоріальні дані. B) Дослідити взаємозв'язок між змінними. C) Створювати візуальні представлення даних. D) Обчислювати середні значення числових даних.
A) Кількість змінних у моделі. B) Наскільки добре модель відповідає спостережуваним даним. C) Розмір набору даних. D) Тип використаного статистичного тесту.
A) Нормальний розподіл залишків B) Лінійність C) Гомоскедастичність D) Незалежність спостережень
A) Перехресна перевірка B) Регресійний аналіз C) Тест хі-квадрат D) Аналіз головних компонент
A) PCA B) ANOVA C) Дерево рішень D) Логістична регресія
A) Видалити всі вхідні змінні, крім найважливішої. B) Автоматизувати весь процес моделювання. C) Створення нових вхідних змінних на основі існуючих даних для покращення продуктивності моделі. D) Точно підігнати модель під навчальні дані.
A) Коли модель є правильною і добре узагальнює невидимі дані. B) Коли модель ідеально підходить для навчальних даних, але дає збій на нових даних. C) Коли модель занадто складна і вносить шум у дані. D) Коли модель занадто проста і не має достатньої прогностичної сили.
A) Оцінити відповідність у логістичній регресії. B) Перевірка припущення про лінійність у регресійних моделях. C) Підсумувати розподіл набору даних. D) Оцінити продуктивність моделі класифікації.
A) Створити єдиний складений показник з декількох змінних. B) Дослідити причинно-наслідкові зв'язки. C) Групування схожих даних на основі шаблонів або ознак. D) Побудувати графік точок даних у двовимірному просторі. |