A) Створювати візуальні представлення даних. B) Обчислювати середні значення числових даних. C) Підсумувати категоріальні дані. D) Дослідити взаємозв'язок між змінними.
A) Кількість змінних у моделі. B) Розмір набору даних. C) Наскільки добре модель відповідає спостережуваним даним. D) Тип використаного статистичного тесту.
A) Гомоскедастичність B) Незалежність спостережень C) Лінійність D) Нормальний розподіл залишків
A) Логістична регресія B) PCA C) ANOVA D) Дерево рішень
A) Автоматизувати весь процес моделювання. B) Точно підігнати модель під навчальні дані. C) Створення нових вхідних змінних на основі існуючих даних для покращення продуктивності моделі. D) Видалити всі вхідні змінні, крім найважливішої.
A) Підсумувати розподіл набору даних. B) Оцінити продуктивність моделі класифікації. C) Оцінити відповідність у логістичній регресії. D) Перевірка припущення про лінійність у регресійних моделях.
A) Групування схожих даних на основі шаблонів або ознак. B) Створити єдиний складений показник з декількох змінних. C) Побудувати графік точок даних у двовимірному просторі. D) Дослідити причинно-наслідкові зв'язки.
A) Коли модель ідеально підходить для навчальних даних, але дає збій на нових даних. B) Коли модель є правильною і добре узагальнює невидимі дані. C) Коли модель занадто складна і вносить шум у дані. D) Коли модель занадто проста і не має достатньої прогностичної сили.
A) Регресійний аналіз B) Тест хі-квадрат C) Перехресна перевірка D) Аналіз головних компонент |