1. «Извлечение полезных сведений невозможно без хорошего понимания сути данных», верно ли утверждение:
а) верно +
б) неверно. Технологии не нужно понимание данных
в) неверно. Технологии Data Mining не нужен аналитик, поэтому понимание кем-либо данных — излишне
2. Большинство аналитических методов, используемые в технологии Data mining – это:
а) новейшие математические алгоритмы и методы
б) известные математические алгоритмы и методы +
в) классические статистические методы
3. Выберите характеристику, наиболее подходящую для Data Mining:
а) подходит для понимания ретроспективных данных
б) подходит для обобщения ретроспективных данных
в) опирается на ретроспективные данные для получения ответов на вопросы о будущем +
4. Частью какой из перечисленных стадий является валидация закономерностей:
а) свободный поиск +
б) анализ исключений
в) прогностическое моделирование
5. Какая из перечисленных ниже групп методов достаточно часто использует для выявления взаимосвязей в данных концепцию усреднения по выборке:
а) Data Mining
б) OLAP
в) статистические методы +
6. На стадии свободного поиска осуществляется:
а) использование выявленных закономерностей для предсказания неизвестных значений
б) выявление закономерностей +
в) анализ исключений
7. В результате использования инструментов Data Mining пользователь может:
а) получить гипотезы о взаимосвязях в данных, самостоятельно выдвинутые инструментом Data Mining
б) получить подтверждение или опровержение гипотез, выдвинутых пользователем
в) оба варианта верны +
г) нет верного ответа
8. Нейронные сети относятся к группам:
а) методов на основе уравнений +
б) статистических методов
в) методов кросс-табуляции
9. Закономерности, найденные в процессе использования технологии Data Mining должны обладать такими свойствами:
а) быть очевидными
б) чем больше найдено закономерностей, тем лучше
в) быть неочевидными +
10. Какой из перечисленных ниже пунктов не является названием стадии Data Mining:
а) свободный поиск
б) индукция правил +
в) анализ исключений
11. Закономерности, найденные в процессе использования технологии Data Mining должны обладать такими свойствами:
а) быть объективными +
б) быть очевидными
в) чем больше найдено закономерностей, тем лучше
12. Какие из перечисленных ниже пунктов являются названиями стадий Data Mining:
а) прогностическое моделирование
б) свободный поиск
в) оба варианта верны +
г) нет верного ответа
13. Инструменты Data Mining:
а) могут самостоятельно строить гипотезы о взаимосвязях в данных +
б) могут самостоятельно строить гипотезы о взаимосвязях в данных, которые обязательно подтверждаются
в) не могут самостоятельно строить гипотезы о взаимосвязях в данных
14. Для какой шкалы применимы только такие операции как равно, не равно, больше, меньше:
а) номинальная шкала
б) интервальная шкала
в) порядковая шкала +
15. Если сравнивать Data Mining, машинное обучение и статистику, какая из дисциплин сконцентрирована на едином процессе анализа данных, включает очистку данных, обучение, интеграцию и визуализацию результатов:
а) Data Mining +
б) статистика
в) машинное обучение
16. К какой категории данных относится вес измеряемых объектов:
а) дискретным данным
б) непрерывным данным +
в) оба варианта верны +
г) нет верного ответа
17. Назовите фактор, обусловивший возникновение и развитие Data Mining:
а) совершенствование аппаратного и программного обеспечения
б) совершенствование технологий хранения и записи данных
в) оба варианта верны +
г) нет верного ответа
18. Для какой шкалы применимы только такие операции как равно и не равно:
а) порядковая шкала
б) номинальная шкала +
в) интервальная шкала
19. В процессе работы Data Mining программы пользователь может получить такие результаты:
а) только статистически достоверные результаты
б) только верные результаты, ложные выводы исключены
в) большой процент ложных, недостоверных или бессмысленных результатов +
20. Такие данные как температура воздуха относятся к:
а) дискретным данным
б) непрерывным данным +
в) оба варианта верны +
г) нет верного ответа
21. Data Mining — это процесс обнаружения в сырых данных знаний, необходимых для:
а) принятия решений в различных сферах человеческой деятельности +
б) увеличения стоимости анализа данных
в) замены аналитика в процессе принятия решений
22. Объект описывается как:
а) свойство, характеризующее объект
б) набор атрибутов +
в) поле таблицы
23. Подготовка данных в процессе Data Mining является:
а) необязательным этапом работы
б) может вообще отсутствовать
в) существенным этапом работы +
24. Свойство, характеризующее объект:
а) Данные
б) Атрибут +
в) Инструменты Data Mining
25. Какая из перечисленных дисциплин более сосредоточена на теории проверки гипотез:
а) Data Mining
б) визуализация
в) статистика +
26. Процесс обнаружения в сырых данных знаний, необходимых для принятия решений в различных сферах человеческой деятельности:
а) Данные
б) Data Mining +
в) Атрибут
27. Data Mining — это процесс обнаружения в сырых данных:
а) практических закономерностей +
б) большого количества закономерностей
в) ранее сформулированных гипотез
28. Номинальная шкала – это шкала:
а) содержащая категории, которые могут упорядочиваться
б) содержащая только две категории
в) содержащая только категории, которые не могут упорядочиваться +
29. Data Mining — это процесс обнаружения в сырых данных:
а) объективных закономерностей +
б) ранее сформулированных гипотез
в) большого количества закономерностей
30. Объектом не является:
а) строка таблицы
б) переменная +
в) запись