Главная / Базы данных / Интеллектуальный анализ данных средствами MS SQL Server 2008

Интеллектуальный анализ данных средствами MS SQL Server 2008 - ответы на тесты Интуит

Правильные ответы выделены зелёным цветом.
Все ответы: Курс посвящен использованию технологии интеллектуального анализа данных (Data Mining) и ее реализации в Microsoft SQL Server 2008 и связанных программных продуктах.
Выберите корректное утверждение относительно упрощенного алгоритма Байеса:
(1) предполагается, что все входные атрибуты взаимосвязаны
(2) предполагается, что все входные атрибуты взаимно независимы
(3) никаких предположений относительно степени взаимной зависимости входных атрибутов не делается
В приведенном списке отметьте все типы данных, поддерживаемых языком DMX
(1) Text
(2) Long
(3) Integer
(4) Double
(5) Boolean
(6) Date
(7) Time
В приведенном списке отметьте все характерные особенности алгоритма Microsoft Naive Bayes:
(1) входные атрибуты с типом содержимого Continuous (непрерывный) не допускаются
(2) должен быть определен хотя бы один выходной атрибут
(3) выходной атрибут должен быть числовым с типом содержимого Continuous (непрерывный)
(4) входные атрибуты могут иметь только числовые типы данных
Определение методами интеллектуального анализа значения непрерывного числового параметра на основании значений независимых переменных производится при решении задачи:
(1) классификации
(2) кластеризации
(3) регрессии
Выходной числовой параметр алгоритма Microsoft Decision Trees, может быть …:
(1) только непрерывным
(2) только дискретным (или дискретизированным)
(3) как непрерывным, так и дискретным (или дисретизированным)
Тип содержимого key sequence может применяться только:
(1) в моделях кластеризации последовательностей
(2) в моделях кластеризации
(3) в моделях временных рядов
(4) в моделях взаимосвязей (ассоциативных правил)
Параметр MAXIMUM_STATES указывает максимальное количество состояний атрибута, поддерживаемое алгоритмом Если количество состояний больше, то алгоритм использует наиболее частые состояния атрибутов и считает остальные состояния отсутствующими Значение по умолчанию для этого параметра алгоритма Microsoft Naive Bayes:
100
В приведенном списке отметьте службы Microsoft SQL Server 2008 (2008 R2), которые содержат реализацию встроенных алгоритмов Data Mining (выберите один вариант):
(1) Database Engine
(2) Analysis Services
(3) Integration Services
(4) Reporting Services
Выберите наиболее точное утверждение относительно алгоритма Microsoft Linear Regression в SQL Server 2008 (2008 R2):
(1) Microsoft Linear Regression ( это алгоритм с полностью самостоятельной реализацией
(2) выбор Microsoft Linear Regression приводит к вызову алгоритма Microsoft Decision Trees c особыми параметрами
(3) выбор Microsoft Linear Regression приводит к вызову алгоритма Microsoft Logistic Regression c особыми параметрами
(4) выбор Microsoft Linear Regression приводит к вызову алгоритма Microsoft Neural Networks c особыми параметрами
Для создания временной структуры интеллектуального анализа данных в операторе CREATE MINING STRUCTURE надо использовать ключевое слово:
(1) INTERIM
(2) SESSION
(3) TEMPORARY
(4) TRANSIENT
Укажите параметр алгоритма Microsoft Decision Trees, который определяет метод, используемый для разбиения узлов (использовать бинарное разбиение или полное):
(1) SPLIT_METHOD
(2) SCORE_METHOD
(3) COMPLEXITY_PENALTY
(4) MAXIMUM_OUTPUT_ATTRIBUTES
Создаваемый при проведении интеллектуального анализа средствами Microsoft SQL Server объект, представляющий собой сочетание данных, алгоритма интеллектуального анализа, набора параметров и фильтров, называется:
(1) структура интеллектуального анализа данных
(2) модель интеллектуального анализа данных
(3) источник данных
(4) представление источника данных
В приведенном списке отметьте два основных формата представления временных рядов, применяемых в ходе интеллектуального анализа данных:
(1) столбчатый
(2) чередующийся
(3) непрерывный
(4) перекрестный
Флаг моделирования REGRESSOR указывается:
(1) для отдельного столбца (атрибута)
(2) для модели целиком
(3) для структуры целиком
(4) для базы данных аналитических служб
Параметр PERIODICITY_HINT алгоритма Microsoft Time Series позволяет:
(1) явно указать алгоритму известную периодичность
(2) указать алгоритму на необходимость автоматически определять периодичность
(3) указать алгоритму, что из исходного набора нужно с заданной периодичностью резервировать данные в обучающую выборку
В приведенном ниже списке отметьте алгоритмы интеллектуального анализа данных, включаемые в поставку Microsoft SQL Server 2008 (2008 R2):
(1) Microsoft Naive Bayes
(2) Microsoft Bayes Networks
(3) Microsoft Neural Network
(4) Microsoft Sequence Clustering
В SQL Server 2008 алгоритм Microsoft Clustering содержит реализацию двух алгоритмов кластеризации:
(1) к-средних (c-means)
(2) "нечеткий" алгоритм к-средних (Fuzzy с-means)
(3) дерево авторегрессии с перекрестным прогнозированием (ARTxp)
(4) алгоритм максимизации ожиданий (Expectation Maximization)
В языке DMX указывать используемый алгоритм интеллектуального анализа надо (выберите наиболее точный ответ):
(1) только при создании структуры
(2) только при создании модели
(3) как при создании структуры, так и при создании модели, причем названия алгоритмов должны совпадать
(4) как при создании структуры, так и при создании модели, причем названия алгоритмов могут быть различны
В приведенном списке отметьте характерные особенности алгоритма Microsoft Clustering:
(1) обязательно должен присутствовать ключевой столбец, применение составных ключей не допускается
(2) наличие прогнозируемого столбца необязательно
(3) варианты с вложенными таблицами алгоритмом не поддерживаются
Среди перечисленных алгоритмов, поддерживаемых Microsoft SQL Server 2008, отметьте те, с помощью которых можно решить задачу нахождения групп общих элементов в транзакциях (например, товаров, часто встречающихся в "одном чеке" в магазине):
(1) Microsoft Association Rules
(2) Microsoft Logistic Regression
(3) Microsoft Decision Trees
(4) Microsoft Clustering
Термин "жесткая кластеризация" означает что:
(1) каждый вариант будет отнесен только к одному кластеру
(2) каждый вариант будет отнесен к одному или нескольким кластерам с разными вероятностями
(3) каждый кластер будет содержать ровно один вариант
Если столбец исходных данных, помещаемых в модель или структуру оператором INSERT INTO, не должен использоваться для заполнения структуры или модели (те пропускается), это указывается с помощью:
(1) символа пробела в соответствующей позиции
(2) ключевого слова SKIP в соответствующей позиции
(3) ключевого слова NULL в соответствующей позиции
(4) ключевого слова MISSING в соответствующей позиции
У многих встроенных в SQL Server 2008 алгоритмов интеллектуального анализа есть параметр MAXIMUM_INPUT_ATTRIBUTES (максимальное количество входных атрибутов, которые алгоритм может обработать перед вызовом процедуры выбора характеристик) со значением по умолчанию:
255
Отметьте версии Microsoft SQL Server 2008 (2008 R2), в которых поддерживается проведение перекрестной проверки:
(1) Standard
(2) Express
(3) Developer
(4) Enterprise
(5) Web
В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules, чтобы оценить взаимную зависимость двух элементов используется показатель importance (важность) Importance({A,B})=1 означает что (выберите наиболее точный ответ):
(1) элементы A и B на 100% взаимозависимы (всегда встречаются вместе)
(2) элементы A и B независимы
(3) A и B имеют положительную корреляцию
(4) A и B имеют отрицательную корреляцию
В результате выполнения оператора DELETE FROM MINING STRUCTURE <имя структуры>CASES
(1) содержимое структуры интеллектуального анализа данных и связанных с ней моделей интеллектуального анализа данных удаляется
(2) содержимое структуры удаляется (кэш вариантов очищается), а связанные с ней модели остаются без изменений
(3) удаляется структура интеллектуального анализа данных со всем содержимым и моделями
В запросах к модели, основанной на алгоритме Microsoft Sequence Clustering, в которых требуется получить наиболее вероятное продолжение последовательности, надо использовать функцию:
(1) Predict()
(2) PredictSequence()
(3) PredictNext()
(4) PredictProbability()
Процедуру "очистки" исходных данных рекомендуется производить:
(1) до создания модели интеллектуального анализа
(2) после создания и обработки (обучения) модели интеллектуального анализа
(3) после проведения тестирования (оценки точности) модели интеллектуального анализа
Нейронная сеть, формируемая алгоритмом Microsoft Neural Network, может включать:
(1) только один слой нейронов
(2) только два слоя нейронов
(3) до трех слоев нейронов
(4) до четырех слоев нейронов
Чтобы оператор DMX SELECT вернул не весь набор записей, а только первые 5, надо использовать формат:
(1) SELECT 5 …
(2) SELECT TOP 5 …
(3) SELECT FIRST 5 …
В модели, использующей алгоритм Microsoft Neural Network, вложенная таблица…
(1) может использоваться и как входной, и как прогнозируемый атрибут
(2) не может использоваться ни как входной, ни как прогнозируемый атрибут
(3) может использоваться как входной атрибут, но не может использоваться в качестве прогнозируемого
(4) может использоваться как прогнозируемый атрибут, но не может использоваться в качестве входного
Выберите наиболее точное продолжение фразы: "Перекрёстная проверка может использоваться для оценки точности модели …"
(1) только в случае решения предсказательных задач интеллектуального анализа
(2) только в случае решения описательных задач интеллектуального анализа
(3) при решении как предсказательных, так и описательных задач интеллектуального анализа
Выберите наиболее корректное продолжение фразы: "При использовании алгоритма Microsoft Naive Bayes числовые входные параметры…"
(1) могут быть только непрерывными
(2) могут быть только дискретными
(3) могут быть только дискретными или дискретизированными
(4) могут быть дискретными, дискретизированными или непрерывными
В приведенном списке отметьте типы содержимого (Внимание! Не перепутайте с типами данных!), поддерживаемые языком DMX:
(1) Text
(2) Discrete
(3) Discretized
(4) Long
(5) Continuous
(6) Double
Чтобы на SQL Server 2008 (2008 R2) создать модель интеллектуального анализа, использующую стандартную реализацию упрощенного алгоритма Байеса, в коде на DMX в качестве названия алгоритма надо указать:
(1) Bayes
(2) Naive Bayes
(3) Microsoft_Naive_Bayes
(4) Microsoft Naive Bayes
В приведенном списке отметьте задачи интеллектуального анализа данных, относящиеся к классу "обучение с учителем":
(1) классификация
(2) кластеризация
(3) регрессия
(4) поиск ассоциативных правил
Деревья решений позволяют решать задачи (отметьте все подходящие варианты):
(1) классификации
(2) кластеризации
(3) регрессии
(4) поиска взаимосвязей
Тип содержимого key time может применяться только:
(1) в моделях кластеризации последовательностей
(2) в моделях кластеризации
(3) в моделях временных рядов
(4) в моделях взаимосвязей (ассоциативных правил)
Выберите правильное продолжение утверждения относительно алгоритма Microsoft Decision Trees: "Если прогнозируемый атрибут дискретен, а входные данные непрерывны, вход непрерывных столбцов автоматически …":
(1) игнорируется
(2) дискретизируется
(3) кластеризуется
(4) усредняется
Внешние приложения могут взаимодействовать со службами Analysis Services, используя протокол:
(1) XMLA
(2) SQL
(3) LDAP
(4) SNMP
В алгоритмах регрессии "регрессором" называется:
(1) независимая переменная (аргумент)
(2) зависимая переменная
(3) выявленная алгоритмом зависимость
Указать, что в структуре интеллектуального анализа необходимо резервировать данные для проверочного набора, можно с помощью ключевых слов:
(1) WITH HOLDOUT
(2) WITH RESERVATION
(3) WITH TEST_SET
В приведенном списке отметьте характерные особенности алгоритма Microsoft Linear Regression:
(1) каждая модель должна содержать один ключевой столбец (тип key); составные ключи не допускаются
(2) необходимо наличие как минимум одного прогнозируемого столбца
(3) допустимы прогнозируемые столбцы с типом данных Text
В приведенном списке выберите корректное утверждение относительно структур и моделей интеллектуального анализа
(1) структура содержит модели, которые используются для анализа ее данных
(2) модель содержит структуры, которые используются для анализа ее данных
(3) модели и структуры – это несвязанные типы объектов, ни один из них не может включать (содержать) другой
Выберите наиболее корректное продолжение фразы "Реализация алгоритма ARIMA добавлена в алгоритм Microsoft Time Series, чтобы улучшить…":
(1) точность прогноза ближайших членов ряда
(2) точность долгосрочного прогноза
(3) точность прогноза при наличии трендов
(4) точность прогноза при наличии периодичности
Создать новую модель интеллектуального анализа данных в существующей структуре можно с помощью оператора:
(1) ALTER MINING STRUCTURE …
(2) CREATE MINING MODEL …
(3) MAKE NEW MINING MODEL IN …
Для алгоритма Microsoft Time Series значением по умолчанию параметра FORECAST_METHOD является:
(1) ARTXP
(2) ARIMA
(3) MIXED
Укажите число стандартных алгоритмов интеллектуального анализа данных, включаемых в поставку SQL Server 2008 (2008 R2):
9
Алгоритм "к-средних" (c-means) относится к алгоритмам …
(1) классификации
(2) "жесткой" кластеризации
(3) "мягкой" кластеризации
(4) поиска взаимосвязей
Если при создании модели интеллектуального анализа для столбца установлен флаг PREDICT, это означает:
(1) столбец является только входом
(2) столбец является только выходом
(3) столбец является как входом, так и выходом
У алгоритма Microsoft Clustering есть параметр MINIMUM_SUPPORT Он указывает:
(1) минимальное число создаваемых кластеров
(2) минимальный размер кластера
(3) минимальную оценку вероятности принадлежности, при которой вариант считается включенным в кластер
Среди перечисленных алгоритмов, поддерживаемых Microsoft SQL Server 2008, отметьте те, с помощью которых можно решить задачу классификации (прогнозирования дискретного атрибута):
(1) Microsoft Linear Regression
(2) Microsoft Naive Bayes
(3) Microsoft Decision Trees
(4) Microsoft Time Series
При использовании масштабируемого алгоритма максимизации ожидания на больших объемах данных, в SQL Server 2008 по умолчанию сначала анализируется:
(1) 1 000 вариантов (записей)
(2) 5 000 вариантов (записей)
(3) 10 000 вариантов (записей)
(4) 50 000 вариантов (записей)
(5) 100 000 вариантов (записей)
Пусть необходимо с помощью оператора INSERT INTO обработать структуру, включающую вложенные таблицы В приведенном списке выберите инструкцию, которую нужно использовать для формирования набора данных, помещаемого в структуру:
(1) OPENQUERY
(2) OPENROWSET
(3) SHAPE
Выберите правильное утверждение относительно алгоритма Microsoft Association Rules:
(1) входные столбцы могут быть только непрерывными
(2) входные столбцы могут быть только дискретными
(3) входные столбцы должны быть дискретными или дискретизированными
(4) входные столбцы могут иметь любой допустимый DMX тип содержимого
Отметьте версии Microsoft SQL Server 2008 (2008 R2), в поставку которых включены стандартные алгоритмы интеллектуального анализа данных:
(1) Standard
(2) Express
(3) Developer
(4) Enterprise
(5) Web
Корректно завершите утверждение: "Microsoft Sequence Clustering является гибридным алгоритмом, сочетающим методы кластеризации с…":
(1) анализом марковских цепей
(2) анализом нейронных сетей
(3) поиском ассоциативных правил
Сохранить модель или структуру интеллектуального анализа в файл резервной копии служб Analysis Services можно с помощью инструкции:
(1) EXPORT
(2) IMPORT
(3) SAVE
(4) COPY
У алгоритма Microsoft Sequence Clustering есть параметр CLUSTER_COUNT, указывающий примерное количество кластеров, создаваемых алгоритмом Его значение по умолчанию:
10
Ниже перечислены рекомендуемые этапы проведения интеллектуального анализа данных Расставьте их в правильной последовательности. Ответ укажите в виде последовательности чисел, например 654321
  • изучение данных
  • подготовка данных
  • постановка задачи
  • развертывание и обновление моделей
  • построение моделей
  • исследование и проверка моделей
  • 321564
    В качестве функции активации в алгоритме Microsoft Neural Network скрытые нейроны используют:
    (1) функцию тангенса
    (2) функцию гиперболического тангенса
    (3) функцию гиперболического синуса
    (4) сигмоидальную (логистическую) функцию
    Функция DMX, возвращающая истину, если вариант принадлежит обучающему набору данных, это:
    (1) TraningSet()
    (2) IsTrainingCase()
    (3) LearningCase()
    (4) InLearningSet()
    В алгоритме Microsoft Neural Network соотношение числа скрытых, входных и выходных нейронов указывается с помощью параметра:
    (1) HIDDEN_NODE_RATIO
    (2) HOLDOUT_PERCENTAGE
    (3) SAMPLE_SIZE
    Среди перечисленных средств оценки точности, выберите те, что плохо применимы в случае решения описательных задач интеллектуального анализа:
    (1) диаграмма точности прогнозов
    (2) матрица классификации
    (3) перекрестная проверка
    Среди представленных в списке алгоритмов интеллектуального анализа выберите наиболее быстрый (требующий наименьшего количества вычислений):
    (1) Microsoft Clustering
    (2) Microsoft Naive Bayes
    (3) Microsoft Neural Network
    Выберите корректное продолжение фразы "Значения в ключе вложенной таблицы должны быть …"
    (1) одинаковыми в рамках одного варианта, но не должны совпадать у различных вариантов;
    (2) уникальными для каждого варианта, но во всем множестве вариантов могут быть повторяющиеся значения;
    (3) уникальными, ни в одном варианте, ни в рамках всего множества вариантов повторения не допускаются
    Выберите наиболее точное утверждение относительно алгоритма Microsoft Naive Bayes:
    (1) алгоритм поддерживает детализацию
    (2) алгоритм ограниченно поддерживает детализацию (в зависимости от типа выходных и выходных параметров)
    (3) алгоритм не поддерживает детализацию
    В приведенном списке отметьте задачи интеллектуального анализа данных, относящиеся к классу "обучение без учителя":
    (1) классификация
    (2) регрессия
    (3) кластеризация
    (4) поиск ассоциативных правил
    Явление, заключающееся в том, что модель отлично классифицирует данные из обучающего набора, но имеет невысокую точность прогнозирования для новых данных, принято называть:
    (1) переобучение
    (2) недостаточное обучение
    (3) избыточность
    (4) зацикленность
    Выберите корректное продолжение фразы: "В SQL Server 2008 (2008 R2) типы содержимого Time и Sequence поддерживаются …"
    (1) только стандартными алгоритмами (Microsoft)
    (2) только алгоритмами сторонних производителей (не Microsoft)
    (3) как стандартными алгоритмами, так и алгоритмами сторонних производителей
    Выберите правильное продолжение утверждения: "Параметр FORCE_REGRESSOR, требующий от алгоритма обязательно использовать указанные столбцы в качестве регрессоров …"
    (1) может использоваться для деревьев решений только при прогнозировании категориального атрибута (текстового или дискретного числового)
    (2) может использоваться для линейной регрессии и деревьев решений, прогнозирующих непрерывный атрибут
    (3) не может использоваться ни для линейной регрессии, ни для деревьев решений
    Используемый SQL Server 2008 (2008 R2) язык запросов интеллектуального анализа данных называется:
    (1) MDX
    (2) DMX
    (3) SQL
    (4) SQL/MM
    При анализе временных рядов, как правило, предполагается, что предсказываемый атрибут:
    (1) текстовый
    (2) числовой непрерывный
    (3) числовой дискретный
    Если надо гарантировать возможность повторного создания такого же разбиения исходных данных на обучающий и проверочный набор (при условии, что исходные данные остались прежними), при создании структуры…
    (1) нужно оставить все настройки по умолчанию
    (2) нужно поставить ключевое слово REPEATABLE и в скобках указать ненулевое целое значение
    (3) нужно поставить ключевое слово REPEATABLE и в скобках после него поставить "0"
    Для алгоритма Microsoft Time Series параметром MISSING_VALUE_SUBSTITUTION определяется:
    (1) порядок обработки пропущенных значений ряда
    (2) порядок резервирования данных для проверочного набора
    (3) порядок формирования моделей "с предысторией" для оценки точности
    Выберите корректное продолжение фразы: "В структуре интеллектуального анализа данных можно …"
    (1) выделить обучающий и проверочный набор данных
    (2) указать алгоритм интеллектуального анализа
    (3) определить фильтры для данных
    В Microsoft SQL Server 2008 учет перекрестного влияния временных рядов производится алгоритмом Microsoft Time Series в случае использования (отметьте все подходящие варианты):
    (1) алгоритма ARTxp
    (2) алгоритма ARIMA
    (3) алгоритма c-means (к-средних)
    Оператор CREATE MINING MODEL позволяет:
    (1) создать новую модель интеллектуального анализа в существующей структуре, независимо от наличия в ней других моделей
    (2) создать новую модель интеллектуального анализа в существующей структуре, если ранее в этой структуре моделей создано не было
    (3) создать новую модель интеллектуального анализа вместе с новой структурой, причем структура и модель будут называться одинаково
    (4) создать новую модель интеллектуального анализа вместе с новой структурой, имя структуры формируется путем добавления "_structure" к имени модели
    Для алгоритма Microsoft Time Series параметр PREDICTION_SMOOTHING указывает:
    (1) как модель должна использовать сочетание двух алгоритмов для оптимизации прогнозов
    (2) интервал времени между двумя последовательными моделями с предысторией
    (3) степень "чувствительности" автоматического обнаружения периодичности
    В приведенном ниже списке выберите алгоритм интеллектуального анализа данных, результаты работы которого при одинаковых настройках и исходных данных могут отличаться в зависимости от используемой редакции SQL Server
    (1) Microsoft Clustering
    (2) Microsoft Linear Regression
    (3) Microsoft Time Series
    По умолчанию алгоритм Microsoft Clustering использует:
    (1) масштабируемую версию алгоритма максимизации ожидания
    (2) немасштабируемую версию алгоритма максимизации ожидания
    (3) масштабируемую версию алгоритма к-средних
    (4) немасштабируемую версию алгоритма к-средних
    Ключевые слова WITH DRILLTHROUGH указанные при создании модели означают, что:
    (1) необходимо резервировать данные для проверочного набора
    (2) не нужно резервировать данные для проверочного набора
    (3) детализация разрешена
    (4) детализация запрещена
    У алгоритма Microsoft Clustering есть параметр, содержащий признак завершения построения модели - оценку максимального числа вариантов, которые могут изменить свое членство в кластерах Этот параметр называется:
    (1) MODELLING_CARDINALITY
    (2) SAMPLE_SIZE
    (3) STOPPING_TOLERANCE
    (4) MINIMUM_SUPPORT
    Задача нахождения групп схожих элементов может быть решена с помощью алгоритма:
    (1) Microsoft Linear Regression
    (2) Microsoft Clustering
    (3) Microsoft Time Series
    В алгоритме Apriori и основанном на нем алгоритме Microsoft Association Rules для измерения популярности набора элементов используется показатель поддержка (англ support) Поддержка набора элементов {A,B} это:
    (1) число транзакций, которые содержат или A, или B, или их вместе
    (2) число транзакций, которые содержат как A, так и B
    (3) сумма числа транзакций, содержащих A, и числа транзакций, содержащих B
    (4) произведение числа транзакций, содержащих A, и числа транзакций, содержащих B
    Если необходимо удалить модель или структуру из базы данных аналитических служб, надо использовать оператор языка DMX:
    (1) CLEAR
    (2) DELETE
    (3) DROP
    (4) KILL
    В алгоритме Microsoft Association Rules минимальное количество элементов, допустимых в наборе, можно указать, используя параметр:
    (1) MINIMUM_IMPORTANCE
    (2) MINIMUM_ITEMSET_SIZE
    (3) MINIMUM_SUPPORT
    В приведенном списке инструментальных средств, входящих в поставку SQL Server 2008 (2008 R2), выберите основное средство разработки решений в области интеллектуального анализа данных:
    (1) SQL Server Management Studio
    (2) SQL Server Business Intelligence Development Studio
    (3) SQL Server Profiler
    (4) Data Profile Viewer
    Корректно завершите утверждение относительно алгоритмов, входящих в стандартную поставку SQL Server 2008: "Алгоритм логистической регрессии, по сути, является …":
    (1) алгоритмом нейронных сетей, запускаемым с особыми параметрами
    (2) алгоритмом деревьев решений, запускаемым с особыми параметрами
    (3) алгоритмом линейной регрессии, запускаемым с особыми параметрами
    (4) упрощенным алгоритмом Байеса, запускаемым с особыми параметрами
    В языке DMX, если необходимо преобразовать возвращаемый запросом результат в "плоский" набор строк (к табличному виду), оператор SELECT дополняют инструкцией:
    (1) TABLE
    (2) PLANE
    (3) FLATTENED
    (4) DISTINCT
    Выберите корректное продолжение утверждения: "Модель, использующая алгоритм Microsoft Neural Network, должна содержать, по крайней мере, …"
    (1) один входной столбец, но может не иметь выходных (прогнозируемых) атрибутов
    (2) два входных столбца и один выходной (прогнозируемый)
    (3) один входной и один выходной (прогнозируемый) столбец
    (4) один входной и два выходных (прогнозируемых) столбца
    Выберите наиболее корректное продолжение фразы "При проведении интеллектуального анализа данных на этапе изучения данных …"
    (1) может проводиться поиск минимальных и максимальных значений параметров, анализ статистических характеристик, сравнение полученных результатов с представлениями о предметной области
    (2) может проводиться удаление "выбросов", обработка отсутствующих значений параметров, численное преобразование (например, нормализация)
    (3) может определяться, нужно ли будет делать прогнозы на основании модели интеллектуального анализа данных или просто найти содержательные закономерности и взаимосвязи
    В качестве функции активации в алгоритме Microsoft Neural Network выходные нейроны используют:
    (1) функцию тангенса
    (2) функцию гиперболического тангенса
    (3) функцию гиперболического синуса
    (4) сигмоидальную (логистическую) функцию
    Пусть мы хотим, чтобы при прогнозирующем соединении автоматически сопоставлялись имена столбцов "исходного" запроса (исходных данных) с совпадающими по именам столбцами модели (те предложение ON можно было бы опустить) Для этого надо использовать инструкцию DMX (выберите наиболее точный вариант):
    (1) NATURAL PREDICTION JOIN
    (2) PREDICTION JOIN
    (3) PREDICTION CROSS JOIN
    (4) SPECIAL PREDICTION JOIN
    Для алгоритма Microsoft Logistic Regression параметр HIDDEN_NODE_RATIO
    (1) неприменим (тк всегда должен быть равен 0)
    (2) может принимать значение True или False (по умолчанию True)
    (3) может принимать неотрицательные целые значения (по умолчанию 10)
    Автоматизировать обновление развернутых в производственной среде моделей интеллектуального анализа данных можно, используя службы:
    (1) Database Engine
    (2) Integration Services
    (3) Reporting Services