Главная /
Искусственный интеллект и робототехника /
Машинное обучение
Машинное обучение - ответы на тесты Интуит
Правильные ответы выделены зелёным цветом.
Все ответы: Курс расширяет и углубляет набор тем, рекомендованный международным стандартом ACM/IEEE Computing Curricula 2001 по дисциплине «Машинное обучение и нейронные сети» (machine learning and neural networks) в разделе «Интеллектуальные системы» (intelligent systems).
Все ответы: Курс расширяет и углубляет набор тем, рекомендованный международным стандартом ACM/IEEE Computing Curricula 2001 по дисциплине «Машинное обучение и нейронные сети» (machine learning and neural networks) в разделе «Интеллектуальные системы» (intelligent systems).
На локальной аппроксимации плотности в окрестности классифицируемого объекта основано:
(1) эмпирическая оценка плотности
(2) восстановление смеси плотностей
(3) параметрическое восстановление плотности
(4) непараметрическое восстановление плотности
Оценкой близости объекта к классу называется функция:
(1)
(2)
(3)
(4)
С чем, из ниже перечисленного сравнивают линейный классификатор?
(1) с аксоном;
(2) с правилом Хебба;
(3) с генетическим алгоритмом;
(4) с нейроном.
С чем, из ниже перечисленного сравнивают линейный классификатор?
(1) с аксоном;
(2) с правилом Хебба;
(3) с генетическим алгоритмом;
(4) с нейроном.
Действительно ли что, ширина полосы максимальна, когда норма вектора w максимальна?
(1) Да
(2) Нет
Что называют задачей восстановления регрессии?
(1) Задача обучения по прецедентам при .
(2) Задача поиска вектора параметров .
(3) Задача поиска минимума среднего квадрата ошибки.
(4) Задача модели регрессии.
Какая формула, из ниже перечисленных, позволяет организовать итерационный процесс?
(1)
(2)
(3)
(4)
В чём заключается задача кластеризации?
(1) разбить обучающую выборку на непересекающиеся подмножества, так, чтобы каждое множество состояло из объектов, близких по метрике , а объекты разных множеств существенно отличались.
(2) распределить все обучающее множество на несколько классов.
(3) упростить обработку данных, т.е. воссоединить множества в один класс.
Верно ли, что частичное обучение - это построение алгоритма классификации ?
(1) Да
(2) Нет
Что, из ниже перечисленного, относится к обучающей выборке?
(1) классификация данных
(2) объекты с известными ответами
(3) алгоритм решающий функцию
Как называется функция в алгоритмах имеющих вид суперпозиции ?
(1) корректирующей операцией;
(2) базовым алгоритмом;
(3) решающим правилом;
(4) алгоритмическим оператором.
Какие алгоритмы лучше работают на больших обучающих выборках?
(1) Бустинг;
(2) Беггинг;
(3) RSM.
Как определяется индикатор ошибки в задачах обучения по прецедентам?
(1) через целевую функцию ;
(2) через функцию потерь ;
(3) через регрессию при .
Что называется переобучением?
(1) описание искомого алгоритма как суперпозиции некоторых элементарных функций;
(2) поиск преобразования исходящего пространства признаков в новое пространство существенно меньшей размерности;
(3) когда по мере увеличения числа используемых признаков средняя ошибка на обучающей выборке монотонно убывает;
(4) когда средняя оценка на независимых контрольных данных сначала уменьшается, затем проходит через точку минимума и далее только возрастает.
Как называется алгоритм, который добавляет к набору G по одному признаку, каждый раз выбирая тот признак, который приводит к наибольшему уменьшению внешнего критерия?
(1) Add;
(2) Bootstrap;
(3) FullSearch;
(4) Поиск в глубину;
(5) Поиск в ширину.
Что поступает на вход рекурсивного алгоритма синтеза бинарного решающего дерева ?
(1) обучающая выборка;
(2) множество элементарных предикатов;
(3) корневая вершина дерева;
(4) максимальный ранг конъюнкций;
(5) ограничение на число конъюнкций .
Что из ниже перечисленного относится к задачам коллаборативной фильтрации?
(1) прогнозирование незаполненных ячеек ;
(2) оценивание функций сходства между клиентами и ресурсами;
(3) прогнозирование временных рядов;
(4) кастомизация негативных данных.
Что из ниже перечисленного представления называется гипотезой условной независимости?
(1) ;
(2) ;
(3) ;
(4) .
Метод обучения - это:
(1) минимизация эмпирического риска
(2) алгоритм для новых объектов выдаёт ответы .
(3) метод по выборке строит алгоритм
(4) отображение вида , которое произвольно выборке ставит в соответствии некоторый алгоритм .
Что называют обучением с подкреплением?
(1) обучение основанное на собственном опыте;
(2) обучение с n-количеством учителей;
(3) обучение к контролирующими параметрами.
Выберите неверные утверждения:
(1) Наивный байесовский классификатор может быть только параметрическим.
(2) Наивный байесовский классификатор будет оптимальным, если признаки действительно независимы.
(3) При классификации объекта заодно оцениваются априорные вероятности его принадлежности каждому из классов.
(4) Наивный байесовский классификатор может быть только непараметрическим.
Какой алгоритм относит классифицируемый объект к тому классу, которому принадлежит обучающий объект?
(1) ближайшего соседа;
(2) ЕМ-алгоритм;
(3) ближайших соседей;
(4) взвешенных ближайших соседей.
Пусть есть задача с 2-мя классами . К какому классу будет относится алгоритм, если ?
(1) +1;
(2) -1;
(3) 0;
(4) к ни какому из перечисленных.
Пусть есть задача с 2-мя классами . К какому классу будет относится алгоритм, если ?
(1) +1;
(2) -1;
(3) 0;
(4) к ни какому из перечисленных.
Что следует из формулы ?
(1) Искомый вектор весов w является линейной комбинацией векторов обучающей выборки, причём только для ;
(2) Условие дополняющей нежесткости;
(3) Разделяющая гиперплоскость сводится к минимизации квадратичной формы при ? ограничениях-неравенствах.
В ядре , параметр - называется:
(1) шириной ядра;
(2) шириной окна;
(3) регрессией;
(4) памятью.
В какой из формул указан итерационный процесс уточнения вектора коэффициентов ?
(1)
(2)
(3)
Что , из ниже перечисленного, служит целями кластеризации?
(1) упрощение дальнейшей обработки данных;
(2) сокращение объема хранимых данных;
(3) построение иерархии множества объектов;
(4) распределение обучающего множества на несколько классов;
(5) упрощение входных параметров.
Степень доверия классификации называется:
(1) темпом обучения;
(2) таксономией;
(3) отступом объекта;
(4) апроксимацией.
Выберите правильный ответ. Задача классификации - это:
(1) множество объектов, разделенных на классы
(2) исследование влияние одного или нескольких признаков на объект
(3) определение порядка признака согласно рангу
Как называется алгоритм вида ?
(1) базовым алгоритмом;
(2) алгоритмической композицией;
(3) алгоритмом суперпозиции;
(4) оценкой расстояния.
Какие параметры участвуют в алгоритме Беггинга?
(1) максимальное число поколений;
(2) порог качества базовых алгоритмов на контроле;
(3) размер основной популяции;
(4) порог качества базовых алгоритмов на обучении;
(5) размер промежуточной популяции;
(6) длина признакового подописания;
(7) размер элиты, переходящей в следующее поколение без изменений;
(8) длина обучающих подвыборок.
Что называют разностью ?
(1) переобученностью алгоритма на паре выборок ;
(2) частоту ошибок алгоритма a;
(3) отображение ;
(4) индикатор ошибки.
Что называют моделью алгоритмов?
(1) параметрическое семейство отображений А, из которого выбирается искомый алгоритм ;
(2) отображение , которое произвольной обучающей выборке ставит в соответствие некоторый алгоритм из заданной модели алгоритмов А;
(3) в заданном множестве методов обучения М найти метод , выдающий алгоритмы с наилучшей обобщающей способностью.
Как будет называться предикат , если и при заданных достаточно малом и достаточно большом из отрезка [0,1]?
(1) логической -закономерностью для класса ;
(2) непротиворечивой;
(3) частичной.
Что, из ниже перечисленного характерно для предредукции?
(1) Досрочное прекращение дальнейшего ветвления в вершине дерева, если информативность для всех предикатов не дотягивает до заданного порогового значения .
(2) Заменяет отдельные вершины либо одной из дочерних вершин, либо терминальной вершиной.
(3) Заменяет поддерево вершины поддеревом левой дочерней вершины .
(4) Сохраняет поддерево вершины v.
Как называется вектор условных вероятностей , если данный ресурс соответствует теме ?
(1) профиль ресурса ;
(2) вложенным циклом итераций;
(3) матрица кросс-табуляции.
Что означает запись ?
(1) Длину документа в терминах.
(2) Число вхождений термина w во все документы коллекции.
(3) Длину коллекции в терминах.
Функционал среднего риска - это:
(1) ожидаемая величина потери при классификации объектов алгоритмом ;
(2) штраф не правильно соотнесенных классов;
(3) вероятность потери ;
(4) условная вероятность
Как называется метод, который использует жадные действия большую часть времени?
(1) жадным методом;
(2) метод среднего выборочного;
(3) softmax-метод.
Что, из ниже перечисленного, относится к недостаткам квадратичного дискриминанта?
(1) Если , то матрица вырождена.
(2) Чем меньше , тем менее устойчива оценка
(3) Оценки , неустойчивы к шуму.
(4) Если длина выборки меньше размерности пространства, , то матрица становится вырожденной, поскольку ее ранг превышает .
(5) Выборочные оценки чувствительны к нарушениям нормальности распределений.
К какому алгоритму можно отнести формулу: ?
(1) ЕМ-алгоритм;
(2) алгоритм ближайшего соседа;
(3) алгоритм ближайших соседей;
(4) алгоритм взвешенных ближайших соседей.
Как называется величина объекта относительно алгоритма классификации ?
(1) нейроном;
(2) отступом;
(3) аксоном;
(4) дендритом.
Как называется величина объекта относительно алгоритма классификации ?
(1) нейроном;
(2) отступом;
(3) аксоном;
(4) дендритом.
Объекты называются периферийными?
(1) ;
(2) ;
(3) .
При каком размере окна h функция чрезмерно сглаживается?
(1) при слишком широком;
(2) при слишком узком;
(3) при оптимальном значении ширины окна;
(4) при h=0.
Что представляет собой матрица ?
(1) матрицу признаковых описаний объектов;
(2) диагональную матрицу весов объектов;
(3) взвешенную матрицу признаковых описаний объектов;
(4) взвешенный вектор ответов.
Какую функцию невозможно реализовать одним нейроном с 2-мя входами и ?
(1) логическую функция И;
(2) логическую функция ИЛИ;
(3) логическую функция НЕ;
(4) логическую функция XOR.
Какая из формул позволит решить задачу кластеризации?
(1)
(2)
(3)
Что служит индикатором ошибки для задач классификации?
(1)
(2)
(3)
К какому классу отнесет объект решающее правило С: ?
(1) для которого оценка максимальна;
(2) для которого оценка минимальна;
(3) для которого оценка M < 0;
(4) для которого оценка M > 0;
В каком методе базовые алгоритмы обучаются на различных подмножествах признакового описания, которые выделяются случайным образом?
(1) RSM;
(2) Беггинг;
(3) CCEL.
Как определяется функционал полного скользящего контроля?
(1) как средняя частота ошибок на контрольных подвыборках;
(2) как вероятность ошибки ;
(3) как число ошибок алгортма a на выборке .
Определите название данной задачи: имеется конечное множество альтернативных моделей , каждая со своим методом обучения, . Требуется найти модель, наиболее адекватную для данной выборки.
(1) задача выбора модели;
(2) задача настройки гиперпараметра;
(3) задача отбора признаков.
Что, из ниже перечисленного характеризует энтропийное определение информативности?
(1) ;
(2) ;
(3) ;
(4) .
Какой алгоритм подсчитывает долю правил в наборах , относящих объект к каждому из классов?
(1) алгоритм простого голосования;
(2) алгоритм взвешенного голосования;
(3) алгоритм КОРА;
(4) алгоритм ТЭМП.
Что является основой латентного семантического анализа?
(1) матричные разложения;
(2) выявление латентных характеристик для каждого клиента и каждого ресурса;
(3) хранение всей матрицы кросс-табуляции .
Какая запись соответствует числу троек, в которых термин документа d связан с темой t?
(1) ;
(2)
(3)
Если известны и , то минимум среднего риска достигается при:
(1)
(2)
(3)
С какой вероятностью осуществляется выбор действия в t-й игре?
(1) ;
(2)
(3)
Разделяющая поверхность квадратичная для всех , будет вырождена в линейную, если:
(1)
(2)
(3)
(4)
Выберите верные утверждения:
(1) при алгоритм ближайших соседей неустойчив к шуму;
(2) при алгоритм ближайших соседей вырождется в константу;
(3) алгоритм взвешенных ближайших соседей не хранит обучающую выборку целиком;
(4) алгоритм ближайшего соседа устойчив к погрешностям.
Какая, из перечисленных ниже функций, соответствует методу опорных векторов?
(1) квадратичная;
(2) сигмоидная;
(3) кусочно-линейная;
(4) логистическая.
Какая, из перечисленных ниже функций, соответствует методу опорных векторов?
(1) квадратичная;
(2) сигмоидная;
(3) кусочно-линейная;
(4) логистическая.
Если объекты классифицируется правильно и находятся далеко от разделяющей полосы, то их называют:
(1) периферийными;
(2) опорными;
(3) нарушителями.
По какой из формул вычисляются веса в областях локальных сгущений оптимальна меньшая ширина окна?
(1)
(2)
(3)
Что подается на вход в алгоритме IRLS?
(1) матрица "объекты-признаки" и вектор ответов;
(2) обучающая выборка;
(3) обучающая выборка и дискриминантная функция.
Какие пространства признаков называются спрямляющими?
(1) в которых линейный классификатор безошибочно разделяет обучающую выборку;
(2) которые строятся без скрытого слоя;
(3) которые имеют несколько слоев.
Какой алгоритм позволяет найти пару вершин с наименьшим и соединить их ребром?
(1) алгоритм кратчайшего незамкнутого пути;
(2) алгоритм кластеризации;
(3) алгоритм частичного обучения;
(4) алгоритм co-training.
Эмпирический риск - это средняя потеря на одном объекте.
(1) Да
(2) Нет
Какой пример, из ниже перечисленных, является примером простого голосования?
(1) ;
(2) ;
(3) ;
(4) .
Сколько популяций строится на t-м поколении алгоритма CCEL?
(1) ;
(2) ;
(3) ;
(4) .
Как будет выглядеть формула вероятности ошибки в интерпретации обобщающей способности метода ?
(1) ;
(2) ;
(3) ;
(4)
Функционал , характеризующий качество метода по обучающей выборке называют:
(1) внутренним критерием;
(2) ошибкой обучения;
(3) внешним критерием;
(4) минимизацией эмпирического риска.
Что, из ниже перечисленного характеризует статический критерий?
(1) ;
(2) ;
(3) ;
(4) .
Что, из ниже перечисленного является достоинством алгоритма КОРА?
(1) алгоритм способен не только классифицировать объекты, но и объяснять свои решения на языке, понятном специалистом;
(2) при малых , алгоритм очень эффективен;
(3) решает поставленную задачу за операций;
(4) параметр позволяет управлять жадностью алгоритма;
(5) корректность на обучающей выборке гарантируется при достаточно слабыхдополнительных ограничениях;
(6) можно использовать любое семейство базовых предикатов Ф.
Какие данные в качестве входных применяются в алгоритме двухступенчатой симметризации?
(1) профили клиентов;
(2) профили ресурсов;
(3) матрица кросс-табуляции ;
(4) число тем;
(5) число итераций на внешнем цикле .
Какое обозначение соответствует матрице терминов тем Ф?
(1)
(2)
(3)
Какие, из ниже перечисленных подходов, относятся к подходам оцениванию:
(1) Параметрическое оценивание плотности.
(2) Восстановление смеси распределений.
(3) Непараметрическое оценивание плотности.
(4) Дискретное оценивание плотности.
(5) Регрессионное оценивание плотности.
Что называют марковским процессом принятия решений?
(1) задание обучения с подкреплением, удовлетворяющее марковскому свойству;
(2) пространства состояний и действий, которые являются конечными;
(3) при заданном состоянии s и действии a вероятность каждого возможного следующего состояния s'.
Если матрица близка к вырожденной, то это называется:
(1) вероятностным распределением
(2) гаусовским распределением
(3) мультиколлинеарностью
(4) байесовским решающим правилом
Какой получится алгоритм, если ввести функцию ядра невозрастающую на и положив в формуле ?
(1)
(2)
(3)
(4)
Для чего вводится параметрическое семейство априорных распределений ?
(1) чтобы варьировать значением гиперпараметра;
(2) чтобы ослабить априорные ограничения;
(3) чтобы получить квадратичный регуляризатор;
(4) чтобы избежать проблем мультиколлинеарности.
Для чего вводится параметрическое семейство априорных распределений ?
(1) чтобы варьировать значением гиперпараметра;
(2) чтобы ослабить априорные ограничения;
(3) чтобы получить квадратичный регуляризатор;
(4) чтобы избежать проблем мультиколлинеарности.
В чем преимущества SVM перед метдом стохастического градиента?
(1) Вместо многоэкстремальной задачи решается задача квадратичного программирования, имеющая единственное решение.
(2) Автоматически определяется число нейронов скрытого слоя.
(3) Принцип оптимальной разделяющей гиперплоскости приводит к максимизации ширины разделяющей полосы между классами, следовательно, к более уверенной классификации.
(4) Метод опорных векторов устойчив по отношению к шуму в исходных данных.
(5) В общем случае, когда линейная разделимость не гарантируется, не приходится подбирать управляющий параметр алгоритма C.
Как называются методы восстановления регрессии, устойчивые к шуму в исходных данных?
(1) робастными;
(2) жесткой фильтрацией;
(3) мягкой фильтрацией;
(4) скользящими.
Верно ли, что любая непрерывная функция n аргументов на единичном кубе представлена в виде суперпозиции непрерывных функций одного аргумента и операции сложения: ?
(1) Да
(2) Нет
Как называют выражение ?
(1) правилом WTA;
(2) функционалом качества кластеризации;
(3) нейронами Кохонена;
(4) функция расстояния.
За что штрафует функция ?
(1) за уменьшение отступа;
(2) за попадание объекта внутрь разделяющей полосы;
(3) за отображение результата многомерного шкалирования.
Выберите верные утверждения.
(1) класс - это множество всех объектов с определенным значением.
(2) в задачах регрессии допустимым ответом является действительное число или числовой вектор.
(3) в задачах ранжирования ответы получают сразу на множестве объектов.
(4) области минимального объёма с достаточно гладкой границей являются основной составляющей задач ранжирования
Если в корректирующей операции , параметры неотрицательны и нормированы, , то композиция называется:
(1) выпуклой комбинацией базовых алгоритмов;
(2) голосование по большинству;
(3) квазилинейной комбинацией базовых алгоритмов;
(4) областью компетенции.
Что такое рекомбинация в методе CCEL?
(1) генетическая операция, производящая случайные изменения в индивидах популяции П;
(2) функции, оценивающие вклад популяции в композицию;
(3) генетическая операция, порождающая новых индивидов путем попарного скрещивания индивидов популяции П;
(4) генетическая операция, отбирающая N наиболее адекватных индивидов популяции П.
Алгоритмы и неразличимы на выборке , если:
(1) для индикатора ошибки и числа справедлива оценка ;
(2) они допускают ошибки на одних и тех же объектах для всех ;
(3) число классов эквивалентности равно коэффициенту разнообразия .
Как называется функционал ?
(1) ошибкой скользящего контроля;
(2) ошибкой на отложенных данных;
(3) ошибкой обобщения.
Какая формула характерна, если представляет номинальный признак?
(1) ;
(2) ;
(3) ;
(4) .
При каком условии совокупность будет называться представительным набором?
(1) если для любого из ;
(2) если для любых из ;
(3) если каждой закономерности соответствует не подмножество признаков, а подмножество метрик;
(4) если алгоритм правильно классифицирует объект .
Что из ниже перечисленного относится к моделям основанным на хранении исходных данных?
(1) хранение всей исходной матрицы данных ;
(2) сходство клиентов;
(3) оценивание профилей и клиентов;
(4) хранение профилей вместо хранения ;
(5) сходство объектов.
Как будет называться модель, в которой учитывается тройка слов?
(1) униграммной;
(2) биграммной;
(3) триграммной;
(4) n-граммной.
На какой из теории основан байесовский подход?
(1) на теории утверждающей, что если известны априорные вероятности и функции правдоподобия , то минимум среднего риска достигается алгоритмом .
(2) на теории утверждающей, что если известны плотности распределения каждого из классов, то искомый алгорит можно выписать в явном аналитическом виде.
(3) на теории утверждающей, что если классы имеют n-мерные нормальные плотности распределения , то байесовский классификатор задаёт квадратичную разделяющую поверхность.
(4) на теории утверждающей, что если случайная величина равномерно распределена на .
Какую функцию называют функцией ценности состояния для стратегии ?
(1) ;
(2) ;
(3) ;
(4) ;
(5) .
Что применяют для проверки на равенство нулю элементов ковариационной матрицы .
(1) нормальное гауссовское распределение
(2) критерий Стьюдента
(3)
(4) спектральное разложение
Какие, ниже перечисленные, недостатки можно отнести к методу потенциальных функций?
(1) медленно сходится;
(2) результат обучения зависит от порядка предъявления объектов;
(3) приходится хранить обучающую выборку целиком;
(4) неустойчив к шуму;
(5) слишком грубо настраиваются веса .
Какие преимущества, из ниже перечисленных, относятся к преимуществам метода SG?
(1) метод легко реализуется;
(2) метод подходит для динамического обучения;
(3) при большой размерности пространства или малой длине выборки возможно переобучение;
(4) малые изменения обучающей выборки, могут менять результирующий вектор весов.
Какие преимущества, из ниже перечисленных, относятся к преимуществам метода SG?
(1) метод легко реализуется;
(2) метод подходит для динамического обучения;
(3) при большой размерности пространства или малой длине выборки возможно переобучение;
(4) малые изменения обучающей выборки, могут менять результирующий вектор весов.
Что, из ниже перечисленного, является входными данными в последовательном методе активных ограничений?
(1) точка ;
(2) ;
(3) C;
(4) параметр ;
(5) параметр .
Что называют линейной комбинацией признаков с коэффициентами ?
(1) нормальной системой;
(2) линейной моделью регрессии;
(3) псевдообратной матрицей;
(4) проекционной матрицей.
Как называется метод, который позволял вычислять градиент, при котором каждый градиентный шаг выполняется за число операций, лишь немногим больше, чем при обычном вычислении сети на одном объекте?
(1) градиентный спуск;
(2) обратное распространение ошибки;
(3) метод стохастического градиента;
(4) метод сопряженных градиентов.
Что называют нейронами Кохонена?
(1) те нейроны, выход которых минимален;
(2) если центры кластеров взаимно однозначно соответствуют нейронам скрытого слоя;
(3) те нейроны, которые на выходе похожи на исходные.
К какому алгоритму относится недостаток неустойчивого решения, если нет области разреженности?
(1) OBD;
(2) TSVM;
(3) IRLS;
(4) co-learning.
Какие задачи из ниже перечисленных относятся к задачам классификации?
(1) определение наиболее целесообразного способа лечения;
(2) определение длительности и исхода заболевания;
(3) оценивание кредитоспособности заёмщика;
(4) задачи поискового вывода
Чтобы оценить качество алгоритмических операторов надо:
(1) в решающее правило С ввести функцию потерь в пространство оценок ;
(2) инициализировать веса для всех и пока не выполнен критерий останова выполнить ;
(3) инициализировать веса и отступы: для всех и пока не выполнится критерий останова, делать: и для всех .
К любым ли базовым алгоритмам и их методам обучения применим алгоритм CCEL?
(1) Да
(2) Нет
Верно ли, что функция роста не зависит ни от выборки, ни от метода обучения?
(1) Да
(2) Нет
Как называется критерий ?
(1) информационный критерий Акаике;
(2) байесовский информационный критерий;
(3) критерий Вапника-Червоненкиса.
Что называют зонами значений признака ?
(1) предикат вида ;
(2) точки принадлежащие классу ;
(3) число термов в конъюнкции.
Выберите верный вариант. Если для каждого класса построено множество логических правил, специализирующихся на различении объектов данного класса и если , то:
(1) правило описывает объект к классу С;
(2) правило воздержится от классификации объекта Х;
(3) правило отнесет объект к другому классу.
Что является недостатком тривиальной рекомендующей системой?
(1) не учитываются интересы конкретного пользователя;
(2) проблема "холодного старта";
(3) надо хранить всю матрицу F;
(4) нечего рекомендовать новым пользователям.
Приведение каждого слова в документе к его нормальной форме называется:
(1) лемматизацией;
(2) униграммной;
(3) стеммингом.
Вероятность правильной классификации имеет вид:
(1)
(2)
(3)
(4)
(5) Все виды неверны
Предположим, что требуется оценить величину , имея набор эпизодов, полученных при применении стратегии и прохождении через состояние s. Как тогда будет называться каждое появление состояния s в эпизоде?
(1) посещение s;
(2) первое посещение;
(3) перебор состояния s;
(4) действие.
Какая функция, из перечисленных ниже, является кусочно-постоянной?
(1)
(2)
(3)
(4)
Отступом (margin) объекта относительно алгоритма классификации, имеющего вид называется величина:
(1)
(2)
(3)
(4)
Какой вид будет иметь правило обновления весов на каждой итерации метода стохастического градиента?
(1) ;
(2) ;
(3) ;
(4) .
Какой вид будет иметь правило обновления весов на каждой итерации метода стохастического градиента?
(1) ;
(2) ;
(3) ;
(4) .
Выберите верное утверждение.
(1) Если и , то объект переводится из в .
(2) Метод INCAS не позволяет решать задачи с шумовыми выбросами.
(3) Метод INCAS особенно эффективен, когда число опорных векторов невелико.
(4) Если и , то объект переводится из в .
Что надо добавить для решения проблемы мультиколлинеарности?
(1) параметр ;
(2) диагональную матрицу
(3) функционал Q, который штрафует большие значения нормы вектора весов ||a||.
Как называется метод, который удаляет те связи, к изменению которых функционал Q наименее чувствителен?
(1) метод сопряженных градиентов;
(2) метод стохастического градиента;
(3) метод оптимального прореживания сети;
(4) метод обратного распространения ошибки.
Какое правило означает следующая формула ?
(1) правило мягкой конкуренции WTH;
(2) правило жесткой конкуренции WTA;
(3) правило справедливой конкуренции CWTA.
С помощью какой формулы можно оценить вероятность по размеченным данным ?
(1) ;
(2) ;
(3) ;
(4)
Какая, из ниже перечисленных задач, является задачей классификации на 4 класса?
(1)
(2)
(3)
(4)
Чему способствует уменьшение параметра ?
(1) росту числа базовых алгоритмов;
(2) росту числа ошибок;
(3) переобучению;
(4) к ошибке всей композиции.
Какая функция, из ниже перечисленных, представляет собой квазилинейную корректирующую операцию?
(1) ;
(2) ;
(3) ;
(4) .
Какая оценка справедлива для функции роста, если множество А конечно, а число алгоритмов, попарно неразличимы на выборке ?
(1) ;
(2) ;
(3) .
Выберите правильную характеристику для внутреннего критерия.
(1) по мере увеличения сложности модели внутренний критерий монотонно убывает;
(2) по мере увеличения сложности модели внутренний критерий убывает, затем проходит через точку минимума и затем только возрастает;
(3) по мере уменьшения количества обучающих данных модель выдает частоту ошибок алгоритма а.
Какие данные подаются на вход жадного алгоритма слияния зон?
(1) признак ;
(2) желаемое количество зон ;
(3) пары доли ошибок для отбора конъюнкций ;
(4) параметр критерия останова.
Выберите правило, при голосовании которым берётся взвешенная сумма голосов?
(1) ;
(2) ;
(3) ;
Что из ниже перечисленного является типом латентной модели?
(1) ко-кластеризация;
(2) матричная факторизация;
(3) двухступенчатая симметризация;
(4) семантический анализ.
Что представляют векторы в пространстве терминов ?
(1) Центры тематических кластеров.
(2) Эмпирическое распределение .
(3) Порождающее распределение Дирихле.
(4) Степень разреженности векторов , порождаемых распределением .
Выберите правильный ответ. По обучающей выборке настраивается:
(1) контрольная выборка
(2) эмпирическая оценка среднего риска
(3) тестируемый алгоритм
(4) случайная величина
Какая форма будет называться Q-обучением?
(1) ;
(2) ;
(3) .
Если выполнены условия:
1) выборка простая, получена из плотности распределения ;
2) ядро непрерывно, его квадрат ограничен: ;
3) последовательность такова, что и , тогда:
(1) Непараметрическая оценка плотности в точке записывается в следующем виде:
(2) Точечное ядро при единичной ширине окна соответствует
(3) сходится к при для почти всех , причем скорость сходимости имеет порядок .
(4) Эмперическая оценка плотности определяется как доля точек выборки, лежащих внутри отрезка .
Большой положительный отступ, плотно окруженный объектами своего класса имеют:
(1) эталонные объекты;
(2) неинформативные объекты;
(3) пограничные объекты;
(4) ошибочные объекты.
Что получится, если дискриминантная функция определяется как скалярное произведение вектора и вектора параметров ?
(1) линейный классификатор;
(2) гауссовская модель априорного распределения;
(3) априорное распределение Лапласа;
(4) гиперпараметр.
Что получится, если дискриминантная функция определяется как скалярное произведение вектора и вектора параметров ?
(1) линейный классификатор;
(2) гауссовская модель априорного распределения;
(3) априорное распределение Лапласа;
(4) гиперпараметр.
Какая функция не считает за ошибки отклонения от , меньшие ?
(1) ;
(2) ;
(3) ;
К какому методу обучения относится метод главных компонент?
(1) обучение с учителем;
(2) обучение без учителя;
(3) обучение по Хеббу;
(4) обучение функционала.
Что означает, если веса между входными и скрытым слоем будут обнулены?
(1) диагональные элементы доминируют в гессиане.
(2) после стабилизации функционала ошибки Q вектор весов w находится в локальном минимуме.
(3) информация, накопленная в сети, является полезной и не теряется при добавлении новых нейронов.
(4) h-ый нейрон скрытого слоя не будет учитывать j-й признак.
Каким способом можно избавиться от медленной скорости сходимости в правиле WTA?
(1) ввести ядро - неотрицательно монотонно убывающее на функцию расстояния ;
(2) ввести "механизм утомления" победителей;
(3) ввести темп обучения.
Оценка расстояния между двух распределений с помощью статистики - квадрат будет выглядеть:
(1) ;
(2) ;
(3) .
Какой тип экспериментального исследования имеет цель - понимание, на что влияют параметры метода обучения?
(1) исследование задач ранжирования
(2) исследование задач классификации
(3) исследование на модельных данных
Что из ниже перечисленного относится к недостаткам алгоритма AdaBoost?
(1) По мере увеличения числа базовых алгоритмов обобщающая способность может улучшаться;
(2) Склонен к переобучению при наличии значительного уровня шума в данных;
(3) Требует достаточно длинных обучающих выборок;
(4) Простота реализации;
(5) Возможность идентифицировать объекты, являющиеся шумовыми выбросами;
(6) Бустинг может приводить к построению громоздких композиций, состоящих из сотен алгоритмов
Какие параметры используются в алгоритме последовательного построения смеси?
(1) - допустимое число ошибок;
(2) - пороговое значение функции потерь;
(3) - обучающая выборка;
(4) - исходный вектор весов объектов;
(5) - начальное приближение одного из базовых алгоритмов.
Если в семействе А выделена последовательность подсемейств возрастающей ёмкости и в ней можно выбрать оптимальное подсемейство, для которого достигается минимальное значение правой части из формулы , то этот метод называют:
(1) метод роста множества конъюнкций;
(2) метод линейных решающих правил;
(3) метод структурной минимизации риска.
Что должно поступать на вход в алгоритме полного перебора?
(1) множество F;
(2) выборка ;
(3) критерий Q;
(4) параметр d;
(5) вещественный параметр;
(6) параметр В;
(7) Т-число поколений.
Какой алгоритм использует только операцию добавления термов?
(1) жадный алгоритм синтеза конъюнкции;
(2) стохастический локальный поиск;
(3) процедура стабилизации;
(4) процедура редукции.
Как называется основная процедура в алгоритме КОРА?
(1) Нарастить ;
(2) Удалить ;
(3) Перебрать ;
(4) Добавить .
Что из ниже перечисленного является моделью усреднения по блокам?
(1) ;
(2) ;
(3) .
Какая компонента, из ниже перечисленных, является файловой компонентой?
(1) ;
(2) ;
(3) .
В формуле совместной плотности функцией правдоподобия класса будет функция:
(1)
(2)
(3)
(4)
(5)
Какая идея, из ниже перечисленных, описывает идею алгоритма ?
(1) применение - меода прогнозирования, к парам состояние - действие вместо просто действий;
(2) принимать в расчет только те будущие действия, которые предшествуют следующему исследовательскому действию;
(3) использовать алгоритм с одним следом приемлемости для каждого состояния.
Плотность распределения на имеет вид смеси распределений , где - это:
(1) функция правдоподобия -ой компоненты смеси;
(2) априорная вероятность функции правдоподобия
(3) вектор параметров
(4) -й столбец матрицы
(5) порог
Самоорганизующиеся карты Кохонена применяются для:
(1) визуализации многомерных данных;
(2) обучения задач классификации;
(3) выявления ошибки обучения.
По какой из формул параметрическое семейство Ф можно отнести к параметрическому семейству шаров?
(1) ;
(2) ;
(3) .
Как называют априорную вероятность вида: ?
(1) робастной;
(2) тематической;
(3) фоновой;
(4) шумовой.
Идея алгоритма EM заключается в следующем:
(1) при слишком узком окне плотность концентрируется вблизи обучающих объектов, при слишком широком окне плотность чрезмерно сглаживается и в пределе вырождается в константу.
(2) задаются функции правдоподобия и априорные вероятности . Согласно распределению генерируются 2 выборки: обучающая и контрольная . По обучающей выборке настраивается тестируемый алгоритм . По контрольной выборке вычисляется эмпарическая оценка среднего риска.
(3) имея некоторый набор компонент, можно выделить объекты , которые хуже всего описываются смесью - это объекты с наименьшими значениями правдоподобия . По этим объектам строится еще одна компонента. Затем она добавляется в смесь и запускаются EM - итерации, чтобы новая компонента и старые "притёрлись друг к другу". Так продолжается до тех пор, пока все объекты не окажутся покрыты компонентами.
(4) искусственно вводится вспомогательный вектор скрытых переменных , обладающий 2-мя свойствами: первое - он может быть вычислен, если известны значения вектора параметров ; второе - поиск максимума правдоподобия сильно упрощается, если известны значения скрытых переменных.
С помощью какого правила можно построить гладкую аппроксимацию?
(1) правила мягкой конкуренции;
(2) правила справедливой конкуренции;
(3) правила жесткой конкуренции.
Какой входной набор данных характерен для жадного алгоритма построения решающего списка?
(1) Максимальное допустимое число отказов.
(2) Максимальная допустимая доля ошибок на обучающей выборке.
(3) Минимальная допустимая информативность правил в списке.
(4) Множество элементарных предикатов.
(5) Параметр критерия останова.
(6) Максимальное число итераций.
Что, из ниже перечисленного называют метаинформацией?
(1) список авторов , документа d;
(2) список документов , на которые ссылается d;
(3) список категорий рубрикатора;
(4) ссылки и гиперссылки;
(5) тематические наборы документов;
(6) список тематик и словарей.
Константы смеси имеют -мерные нормальные распределения с параметрами , где - это:
(1) вектор матожидания;
(2) ковариационная матрица;
(3) диагональная матрица;
(4) объекты выборки .
Верно ли, что при n=1 многомерное шкалирование позволяет отобразить выборку в виде множества точек на плоскости?
(1) Да
(2) Нет
К чему приводит уменьшение параметра при оптимизации сложности решающего списка?
(1) к снижению числа ошибок на обучении;
(2) к покрытию всей выборки;
(3) к невозможности найти правило с информативностью выше по остатку выборки.
Что характеризует гипотеза условной независимости вида: ?
(1) распределение слов полностью определяется тематикой документа и не зависит от самого документа и его классов;
(2) тематика документа d зависит не от самого документа, а только от того, каким классам он принадлежит;
(3) классификация документа d зависит не от самого документа, а только от его тематики;
(4) ничто из выше перечисленного не является характеристикой гипотезы условий независимости.
От чего зависит функционал стресса ?
(1) от переменных;
(2) от темпа обучения;
(3) от характеристики С;
(4) от входных данных.
Что такое решающее дерево?
(1) алгоритм классификации, основанный на поиске конъюктивных закономерностей;
(2) алгоритм классификации , который задается набором закономерностей приписанных к классам соответственно;
(3) алгоритм классификации, покрывающий набором закономерностей.
Какие модели, из ниже перечисленных относятся к динамическим тематическим моделям?
(1) тематическая модель отдельных категорий;
(2) тематическая модель цитирования авторов;
(3) модель с непрерывным временем;
(4) модель с медленно меняющейся тематикой;
(5) регуляризация матрицы перевода слов;
(6) марковские модели синтаксиса языка.
На предположении, что плотность распределения известна с точностью до параметра, , где - фиксированная функция, основано:
(1) эмпирическая оценка плотности
(2) восстановление смеси плотностей
(3) параметрическое восстановление плотности
(4) непараметрическое восстановление плотности
Локальную аппроксимацию выборки строит алгоритм:
(1)
(2)
(3)
(4)
Что будет называться в параметрическом семействе отображений: , вектором параметров?
(1)
(2)
(3)
(4)
Что будет называться в параметрическом семействе отображений: , вектором параметров?
(1)
(2)
(3)
(4)
Действительно ли что, ширина полосы максимальна, когда норма вектора w минимальна?
(1) Да
(2) Нет
Если функция достаточное число раз дифференцируема по , то:
(1) значение вычисляется для каждого объекта по нескольким ближайшим к нему объектам обучающей выборки.
(2) в точке минимума выполняется система уравнений относительно неизвестных.
(3) обучение регрессионной модели будет производится отдельно в каждой точке пространства объектов .
Как будет выглядеть градиент функционала Q в точке ?
(1)
(2)
(3)
(4)
Какой алгоритм представляет функцию , которая любому объекту ставит в соответствие метку кластера ?
(1) алгоритм кластеризации;
(2) алгоритм backpropagation;
(3) алгоритм OBD.
Верно ли, что трансдуктивное обучение - это построение алгоритма классификации ?
(1) Да
(2) Нет
Объекты состоят из признаков?
(1)
Да
(2)
Нет
Как называется функция в алгоритмах имеющих вид суперпозиции ?
(1) корректирующей операцией;
(2) базовым алгоритмом;
(3) решающим правилом;
(4) алгоритмическим оператором.
Какие алгоритмы лучше работают на коротких обучающих выборках?
(1) Бустинг;
(2) Беггинг;
(3) RSM.
Что называют индикатором ошибки?
(1) -фиксированное неотрицательное число;
(2) алгоритм на произвольной подвыборке ;
(3) бинарную функцию потерь ;
(4) ответ .
Что называют синтезом признаков?
(1) описание искомого алгоритма как суперпозиции некоторых элементарных функций;
(2) поиск преобразования исходящего пространства признаков в новое пространство существенно меньшей размерности;
(3) когда по мере увеличения числа используемых признаков средняя ошибка на обучающей выборке монотонно убывает;
(4) когда средняя оценка на независимых контрольных данных сначала уменьшается, затем проходит через точку минимума и далее только возрастает.
Как называется алгоритм, который осуществляет полный перебор всевозможных наборов признаков G в порядке возрастания сложности?
(1) Add;
(2) Bootstrap;
(3) FullSearch;
(4) Поиск в глубину;
(5) Поиск в ширину.
Что не является входными данными в алгоритме синтеза бинарного решающего дерева ?
(1) обучающая выборка;
(2) множество элементарных предикатов;
(3) корневая вершина дерева;
(4) максимальный ранг конъюнкций;
(5) ограничение на число конъюнкций .
Что из ниже перечисленного не относится к задачам коллаборативной фильтрации?
(1) прогнозирование незаполненных ячеек ;
(2) оценивание функций сходства между клиентами и ресурсами;
(3) прогнозирование временных рядов;
(4) кастомизация негативных данных.
Что из ниже перечисленного представления описывает процесс порождения коллекции D?
(1) ;
(2) ;
(3) ;
(4) .
Этап обучения - это:
(1) минимизация эмпирического риска
(2) алгоритм для новых объектов выдаёт ответы .
(3) метод по выборке строит алгоритм
(4) отображение вида , которое произвольно выборке ставит в соответствии некоторый алгоритм .
Какие элементы, из ниже перечисленных относятся к обучению с подкреплением?
(1) стратегия;
(2) функция поощрения;
(3) функция ценности;
(4) модель поведения;
(5) характеристика.
Укажите, что входит в преимущества байесовского подхода.
(1) На его основе строятся многие методы классификации.
(2) При классификации объекта заодно оцениваются априорные вероятности его принадлежности каждому из классов.
(3) Байесовское решающее правило удобно использовать в качестве эталона при тестировании алгоритмов классификации на модельных данных.
(4) На практике функция правдоподобия классов приходится восстанавливать по конечным выборкам данных.
(5) Известно довольно много методов восстановления плотности, но ни один из них не является безусловно лучшим.
Выберите, какие недостатки относятся к алгоритму ближайшего соседа?
(1) неустойчив к шуму при ;
(2) низкое качество классификации;
(3) отсутствие параметров, которые можно было бы настраивать по выборке;
(4) достигается максимум сразу на нескольких классах;
(5) неустойчив к погрешностям.
Пусть есть задача с 2-мя классами . К какому классу будет относится алгоритм, если ?
(1) +1;
(2) -1;
(3) 0;
(4) к ни какому из перечисленных.
Пусть есть задача с 2-мя классами . К какому классу будет относится алгоритм, если ?
(1) +1;
(2) -1;
(3) 0;
(4) к ни какому из перечисленных.
Какое условие называют условием дополняющей нежёсткости?
(1) ;
(2) ;
(3) .
Следующая формула , называется:
(1) моделью регрессии;
(2) формулой ядерного сглаживания;
(3) формулой метода наименьших квадратов;
(4) ядром.
Выражение для градиента будет выглядеть:
(1)
(2)
(3)
Дробление крупных кластеров на более мелкие называется задачей:
(1) наименьших квадратов
(2) сопряженного градиента
(3) апроксимации
(4) таксономии
Какой алгоритм является self-traning для композиции простого голосования базовых алгоритмов ?
(1) co-learning
(2) co-training
(3) OBD
(4) IRLS
Выберите правильный ответ. Задача регрессии - это:
(1) множество объектов, разделенных на классы
(2) исследование влияние одного или нескольких признаков на объект
(3) определение порядка признака согласно рангу
Как называется функция вида: ?
(1) базовым алгоритмом;
(2) алгоритмической композицией;
(3) алгоритмом суперпозиции;
(4) оценкой расстояния.
Какие параметры участвуют в алгоритме RSM?
(1) максимальное число поколений;
(2) порог качества базовых алгоритмов на контроле;
(3) размер основной популяции;
(4) порог качества базовых алгоритмов на обучении;
(5) размер промежуточной популяции;
(6) длина признакового подописания;
(7) размер элиты, переходящей в следующее поколение без изменений;
(8) длина обучающих подвыборок.
Что называют частотой ошибок алгоритма a на произвольной подвыборке ?
(1) переобученностью алгоритма на паре выборок ;
(2) ;
(3) отображение ;
(4) индикатор ошибки.
Что называют методом обучения?
(1) параметрическое семейство отображений А, из которого выбирается искомый алгоритм ;
(2) отображение , которое произвольной обучающей выборке ставит в соответствие некоторый алгоритм из заданной модели алгоритмов А;
(3) в заданном множестве методов обучения М найти метод , выдающий алгоритмы с наилучшей обобщающей способностью.
Как будет называться закономерность , если ?
(1) логической -закономерностью для класса ;
(2) непротиворечивой;
(3) частичной.
Что, из ниже перечисленного характерно для постредукции?
(1) Досрочное прекращение дальнейшего ветвления в вершине дерева, если информативность для всех предикатов не дотягивает до заданного порогового значения .
(2) Заменяет отдельные вершины либо одной из дочерних вершин, либо терминальной вершиной.
(3) Заменяет поддерево вершины поддеревом левой дочерней вершины .
(4) Сохраняет поддерево вершины v.
В какой модели по данным оцениваются векторы: профили клиентов и профили объектов?
(1) латентная модель;
(2) модель хранения исходных данных;
(3) модель семантического анализа;
(4) модель матричного разложения.
Что означает запись ?
(1) Длину документа в терминах.
(2) Число вхождений термина w во все документы коллекции.
(3) Длину коллекции в терминах.
Величина потери от ошибки - это:
(1) условная вероятность ;
(2) штраф не правильно соотнесенных классов;
(3) ожидаемая величина потери при классификации объектов алгоритмом
(4) вероятность потери
Как называется метод, который варьирует вероятность действий, представляемых посредством некоторой функции от предполагаемых значений ценности?
(1) жадным методом;
(2) метод среднего выборочного;
(3) softmax-метод.
Есть гипотеза, где классы имеют -мерные гауссовские плотности: , где - , то вектором матожидания класса будет:
(1)
(2)
(3)
(4)
К какому алгоритму можно отнести формулу: ?
(1) ЕМ-алгоритм;
(2) алгоритм ближайшего соседа;
(3) алгоритм ближайших соседей;
(4) алгоритм взвешенных ближайших соседей.
Будет ли алгоритм допускать ошибку на объекте , если ?
(1) Да
(2) Нет
Будет ли алгоритм допускать ошибку на объекте , если ?
(1) Да
(2) Нет
Какие объекты называются опорными?
(1) ;
(2) ;
(3) .
При каком размере окна h функция стремится пройти через все точки выборки?
(1) при слишком широком;
(2) при слишком узком;
(3) при оптимальном значении ширины окна;
(4) при h=0.
Что представляет собой матрица?
(1) матрицу признаковых описаний объектов;
(2) диагональную матрицу весов объектов;
(3) взвешенную матрицу признаковых описаний объектов;
(4) взвешенный вектор ответов.
В какой функции множества нулей и единиц линейно неразделимы?
(1) логическую функция И;
(2) логическую функция ИЛИ;
(3) логическую функция НЕ;
(4) логическую функция XOR.
Какая из формул позволит решить задачу частичного обучения?
(1)
(2)
(3)
Как формула подходит для абсолютного значения ошибки для задач регрессии?
(1)
(2)
(3)
Что из ниже перечисленного относится к корректирующим операциям?
(1) простое голосование;
(2) взвешенное голосование;
(3) голосование по старшинству;
(4) метод стохастического градиента;
(5) обучение по Хеббу;
(6) правило мягкой конкуренции.
В каком методе из исходной обучающей выборки длины l формируются различные обучающие подвыборки той же длины l с помощью случайного выбора с возвращениями?
(1) RSM;
(2) Беггинг;
(3) CCEL.
Как определить функционал в качестве вероятности частоты ошибок на контроле превышающее заданное число ?
(1) ;
(2) ;
(3) .
Определите название данной задачи: имеется одна модель А, и один метод обучения с параметром , который не может быть настроен по обучающей выборке. Требуется подобрать наиболее подходящие значения гиперпараметра.
(1) задача выбора модели;
(2) задача настройки гиперпараметра;
(3) задача отбора признаков.
Что, из ниже перечисленного характеризует эффективное вычисление информативности с применением формулы Стирлинга?
(1) ;
(2) ;
(3) ;
(4) .
Какой алгоритм каждому правилу приписывает вес , и при голосовании берётся взвешенная сумма голосов ?
(1) алгоритм простого голосования;
(2) алгоритм взвешенного голосования;
(3) алгоритм КОРА;
(4) алгоритм ТЭМП.
Что является основой анамнестических алгоритмов?
(1) матричные разложения;
(2) выявление латентных характеристик для каждого клиента и каждого ресурса;
(3) хранение всей матрицы кросс-табуляции .
Какая запись соответствует числу троек, в которых термин w связан с темой t?
(1) ;
(2)
(3)
Если известны и , и , а для всех , , то минимум среднего риска достигается при:
(1)
(2)
(3)
Какое соотношение позволяет реализовать идею, согласно которой высокие вознаграждения должны увеличивать вероятность повторного выбора предпринятого действия?
(1) ;
(2)
(3) ;
(4)
(5)
Что называют -мерным нормальным (гауссовским) распределением с вектором матожидания и ковариационной матрицей ?
(1) Скользящий контроль с исключением объектов по одному.
(2) Вероятностное распределение с плотностью
(3) Алгоритм классификации с параметром ширины окна
(4) Оценку априорной вероятности классов
Выберите неверные утверждения:
(1) при алгоритм ближайших соседей неустойчив к шуму;
(2) при алгоритм ближайших соседей вырождется в константу;
(3) алгоритм взвешенных ближайших соседей не хранит обучающую выборку целиком;
(4) алгоритм ближайшего соседа устойчив к погрешностям.
Какая, из перечисленных ниже функций, соответствует линейному дискриминанту Фишера?
(1) квадратичная;
(2) сигмоидная;
(3) кусочно-линейная;
(4) логистическая.
Какая, из перечисленных ниже функций, соответствует линейному дискриминанту Фишера?
(1) квадратичная;
(2) сигмоидная;
(3) кусочно-линейная;
(4) логистическая.
Если объекты классифицируется правильно и лежат в точности на границе разделяющей полосы, то их нахывают:
(1) периферийными;
(2) опорными;
(3) нарушителями.
Формула скользящего контроля с исключением объектов по одному выглядит:
(1)
(2)
(3)
Что получают на выходе в алгоритме IRLS?
(1) функцию преобразования признаков;
(2) вектор коэффициентов линейной комбинации;
(3) коэффициент .
Какие слои в нейронной сети называются скрытыми?
(1) все, кроме последнего;
(2) только, те слои, которые находятся между 1-ым и 2-ым слоем;
(3) все, кроме первого.
Какой алгоритм имеет процедуру удаления k-1 самых длинных ребер?
(1) алгоритм кратчайшего незамкнутого пути;
(2) алгоритм кластеризации;
(3) алгоритм частичного обучения;
(4) алгоритм co-training.
Если происходит средняя потеря на всех объектах, то это есть:
(1) переобучение
(2) эмпирический риск
(3) оценка релевантности
Какой пример, из ниже перечисленных, является примером взвешенного голосования?
(1) ;
(2) ;
(3) ;
(4) .
Как называется процедура создающая индивидов в алгоритме CCEL?
(1) селекция ;
(2) инициализация ;
(3) рекомбинация ;
(4) мутация ;
(5) вклад .
Как будет выглядеть формула вероятности, когда переобученность превышает допустимый порог ?
(1) ;
(2) ;
(3) ;
(4)
Какой метод строит алгоритм, доставляющий минимальное значение внутреннему критерию: ?
(1) метод минимизации эмпирического риска;
(2) метод линейных решающих правил;
(3) метод внутреннего выбора модели;
(4) метод внешнего выбора модели.
Что, из ниже перечисленного характеризует энтропийный критерий?
(1) ;
(2) ;
(3) ;
(4) .
Что, из ниже перечисленного является достоинством алгоритма ТЭМП?
(1) алгоритм способен не только классифицировать объекты, но и объяснять свои решения на языке, понятном специалистом;
(2) при малых , алгоритм очень эффективен;
(3) решает поставленную задачу за операций;
(4) параметр позволяет управлять жадностью алгоритма;
(5) корректность на обучающей выборке гарантируется при достаточно слабыхдополнительных ограничениях;
(6) можно использовать любое семейство базовых предикатов Ф.
Какие данные не являются входными в алгоритме двухступенчатой симметризации?
(1) профили клиентов;
(2) профили ресурсов;
(3) матрица кросс-табуляции ;
(4) число тем;
(5) число итераций на внешнем цикле .
Какое обозначение соответствует матрице тем документов ?
(1)
(2)
(3)
Формула восстановления смеси распределений может выглядеть как:
(1)
(2)
(3)
Что называют финитным марковским процессом принятия решений?
(1) задание обучения с подкреплением, удовлетворяющее марковскому свойству;
(2) пространства состояний и действий, которые являются конечными;
(3) при заданном состоянии s и действии a вероятность каждого возможного следующего состояния s'.
Если нормаль разделяет гиперплоскость неустойчива, то это проявление:
(1) вероятностного распределения
(2) гаусовского распределения
(3) мультиколлинеарности
(4) байесовского решающего правила
Как называется параметр в формуле ?
(1) ширина окна;
(2) метрический классификатор;
(3) усредненное обучение;
(4) вектор матожидания.
Какая величина называется гиперпараметром?
(1) ;
(2) ;
(3) ;
(4) ;
(5) .
Какая величина называется гиперпараметром?
(1) ;
(2) ;
(3) ;
(4) ;
(5) .
В чем недостатки SVN?
(1) Вместо многоэкстремальной задачи решается задача квадратичного программирования, имеющая единственное решение.
(2) Автоматически определяется число нейронов скрытого слоя.
(3) Принцип оптимальной разделяющей гиперплоскости приводит к максимизации ширины разделяющей полосы между классами, следовательно, к более уверенной классификации.
(4) Метод опорных векторов неустойчив по отношению к шуму в исходных данных.
(5) В общем случае, когда линейная разделимость не гарантируется, приходится подбирать управляющий параметр алгоритма C.
Если строится вариационный ряд ошибок и отбрасывается некоторое количество t объектов с наибольшей ошибкой, тогда это называют:
(1) робастными;
(2) жесткой фильтрацией;
(3) мягкой фильтрацией;
(4) скользящими.
Функция F будет называться разделяющими точками множества X, если:
(1) для любых различных существует функция такая, что ;
(2) для любого выполено ;
(3) на произвольном компакте X можно приблизить не только многочленом от исходных переменных, но и многочленом от любого конечного набора функций F, разделяющие точки.
Что такое в формуле: ?
(1) темп обучения;
(2) обучающий объект;
(3) нейрон Кохонена;
(4) функция расстояния.
За что штрафует функция ?
(1) за уменьшение отступа;
(2) за попадание объекта внутрь разделяющей полосы;
(3) за отображение результата многомерного шкалирования.
Верно ли следующее утверждение? Многие виды задач медицинской диагностики решаются задачами классификации.
(1) Да
(2) Нет
Если в корректирующей операции функция принимает только два значения , то множество всех , для которых , называется:
(1) выпуклой комбинацией базовых алгоритмов;
(2) голосование по большинству;
(3) квазилинейной комбинацией базовых алгоритмов;
(4) областью компетенции.
Что такое селекция в методе CCEL?
(1) генетическая операция, производящая случайные изменения в индивидах популяции П;
(2) функции, оценивающие вклад популяции в композицию;
(3) генетическая операция, порождающая новых индивидов путем попарного скрещивания индивидов популяции П;
(4) генетическая операция, отбирающая N наиболее адекватных индивидов популяции П.
Выберите, что подходит под определение коэффициента разнообразия множества алгоритмов А на выборке ?
(1) параметры допускающие ошибки на одних и тех же объектах для всех ;
(2) индикатор ошибки и числа , для которых справедлива оценка ;
(3) число классов эквивалентности, индуцируемых на множестве А отношением неразличимости алгоритмов на выборке
Как называется критерий: ?
(1) скользящий контроль;
(2) полный скользящий контроль;
(3) контроль по отдельным объектам.
Какая формула характерна, если представляет порядковый признак?
(1) ;
(2) ;
(3) ;
(4) .
При каком условии представительный набор называется тупиковым?
(1) если любое его собственное подмножество не является представительным набором;
(2) если для любого из ;
(3) если каждой закономерности соответствует не подмножество признаков, а подмножество метрик;
(4) если алгоритм правильно классифицирует объект .
Что из ниже перечисленного не относится к моделям основанным на хранении исходных данных?
(1) хранение всей исходной матрицы данных ;
(2) сходство клиентов;
(3) оценивание профилей и клиентов;
(4) хранение профилей вместо хранения ;
(5) сходство объектов.
Как будет называться модель, в которой учитывается пара слов?
(1) униграммной;
(2) биграммной;
(3) триграммной;
(4) n-граммной.
Какое выражение, из перечисленных ниже, называется байесовским решающим правилом:
(1)
(2)
(3)
(4)
Какие ценности действий называют методами Монте-Карло?
(1) ;
(2) ;
(3) ;
(4) ;
(5) .
С помощью чего, из ниже перечисленного, можно определить сходство неизвестной и известной выборки?
(1) критерия Стьюдента
(2) спектрального разложения
(3) расстояния Махаланобиса
(4) нормального гауссовского распределения
Какие, ниже перечисленные, недостатки можно отнести к метрическим алгоритмам ?
(1) медленно сходится;
(2) результат обучения зависит от порядка предъявления объектов;
(3) приходится хранить обучающую выборку целиком;
(4) неустойчив к шуму;
(5) слишком грубо настраиваются веса .
Что, из ниже перечисленного, относится к недостаткам метода SG?
(1) метод легко реализуется;
(2) метод подходит для динамического обучения;
(3) при большой размерности пространства или малой длине выборки возможно переобучение;
(4) малые изменения обучающей выборки, могут менять результирующий вектор весов.
Что, из ниже перечисленного, относится к недостаткам метода SG?
(1) метод легко реализуется;
(2) метод подходит для динамического обучения;
(3) при большой размерности пространства или малой длине выборки возможно переобучение;
(4) малые изменения обучающей выборки, могут менять результирующий вектор весов.
Что, из ниже перечисленного, не является входными данными в последовательном методе активных ограничений?
(1) точка ;
(2) ;
(3) C;
(4) параметр ;
(5) параметр .
Что будет являтся решением нормальной системы?
(1)
(2)
(3) вектор
(4)
Какая сеть будет называться полносвязной?
(1) в которой каждый нейрон предыдущего слоя связан со всеми нейронами последующего слоя;
(2) в которой нейроны скрытого слоя не связаны с нейронами последующего слоя;
(3) в которой нейроны предыдущего слоя связаны с нейронами скрытого слоя.
Какой нейрон называют нейроном-победителем?
(1) нейрон, выход которого минимален;
(2) нейрон, который на выходе похож на исходный;
(3) нейрон, скрытого слоя.
К какому алгоритму относится недостаток настройки двух параметров ?
(1) OBD;
(2) TSVM;
(3) IRLS;
(4) co-learning.
Какие задачи, из ниже перечисленных, являются задачами ранжирования?
(1) обнаружение спама
(2) задачи поискового вывода;
(3) определение наиболее целесообразного способа лечения;
Какой алгоритм позволяет получить на выходе алгоритмическую композицию ?
(1) алгоритм взвешенного голосования;
(2) алгоритм классификации объекта комитетом старшинства;
(3) алгоритм построения алгоритмической композиции путем последовательного обучения базовых алгоритмов;
(4) алгоритм построения композиции для голосования по большинству.
Действительно ли, что беггинг работает лучше на больших обучающих выборках?
(1) Да
(2) Нет
Что называют функцией роста множества алгоритмов А?
(1) максимальное значение коэффициента разнообразия по всем возможным выборкам длины L;
(2) число h такое, что и ;
(3) подвыборка из , где выполняется .
Как называется критерий ?
(1) информационный критерий Акаике;
(2) байесовский информационный критерий;
(3) критерий Вапника-Червоненкиса.
Что называют рангом в форме конъюнкций?
(1) предикат вида ;
(2) точки принадлежащие классу ;
(3) число термов .
Выберите верный вариант. Если для каждого класса построено множество логических правил, специализирующихся на различении объектов данного класса и если , то:
(1) правило описывает объект к классу С;
(2) правило воздержится от классификации объекта Х;
(3) правило отнесет объект к другому классу.
Что является недостатком модели от клиента?
(1) не учитываются интересы конкретного пользователя;
(2) проблема "холодного старта";
(3) надо хранить всю матрицу F;
(4) нечего рекомендовать новым пользователям.
Отбрасывание изменяемых частей слов, главным образом, окончаний называется:
(1) лемматизацией;
(2) униграммной;
(3) стеммингом.
Вероятность ошибочной классификации имеет вид:
(1)
(2)
(3)
(4)
(5) Все виды неверны
Какой метод оценивает как среднее значение выгод, соответствующих всем посещениям s в некоторой совокупности эпизодов?
(1) МК - метод всех посещений;
(2) МК - метод первого посещения;
(3) метод поддерживающего изучения;
(4) МК - метод классической итерации.
В какой из выборок является гистограммой значений для оценки плотности:
(1)
(2)
(3)
(4)
Отступ показывает:
(1) ошибочные объекты;
(2) пограничные объекты;
(3) информативные объекты;
(4) эталонные объекты;
(5) степень типичности объекта.
Какой эвристический приём характеризует нормализацию признаков?
(1) , где , , , - соответственно минимальное, максимальное, ср. значение и среднеквадратичное отклонение -го признака.
(2)
(3)
(4)
Какой эвристический приём характеризует нормализацию признаков?
(1) , где , , , - соответственно минимальное, максимальное, ср. значение и среднеквадратичное отклонение -го признака.
(2)
(3)
(4)
Выберите противоречивое утверждение.
(1) Если и , то объект переводится из в .
(2) Метод INCAS не позволяет решать задачи с шумовыми выбросами.
(3) Метод INCAS особенно эффективен, когда число опорных векторов невелико.
(4) Если и , то объект переводится из в .
Каким способом можно получить гребневую регрессию?
(1) добавить функционал Q, который штрафует большие значения нормы вектора весов ||a||;
(2) добавить диагональную матрицу ;
(3) добавить параметр .
Верно ли что, если обучающая выборка имеет большой объем или если решается задача классификации, то можно использовать метод стохастического градиента с адаптивным шагом?
(1) Да
(2) Нет
Какое правило означает следующая формула ?
(1) правило мягкой конкуренции WTH;
(2) правило жесткой конкуренции WTA;
(3) правило справедливой конкуренции CWTA.
С помощью какой формулы можно оценить вероятность по неразмеченным данным и линейной модели?
(1) ;
(2) ;
(3) ;
(4)
Какой пример подходит для задачи восстановления регрессии?
(1)
(2)
(3)
(4)
Что не способствует уменьшению параметра ?
(1) росту числа базовых алгоритмов;
(2) росту числа ошибок;
(3) переобучению;
(4) к ошибке всей композиции.
Что, из ниже перечисленного, называется областью компетенции базового алгоритма ?
(1) ;
(2) ;
(3) ;
(4) .
Семейство линейных решающих правил будет выглядеть как:
(1) ;
(2) ;
(3) .
Выберите правильную характеристику для внешнего критерия.
(1) по мере увеличения сложности модели внешний критерий монотонно убывает;
(2) по мере увеличения сложности модели внешний критерий убывает, затем проходит через точку минимума и затем только возрастает;
(3) по мере уменьшения количества обучающих данных модель выдает частоту ошибок алгоритма а.
Какие данные подаются на вход "градиентного" алгоритма синтеза конъюнкции?
(1) признак ;
(2) желаемое количество зон ;
(3) пары доли ошибок для отбора конъюнкций ;
(4) параметр критерия останова.
Выберите правило, которое подсчитывает долю голосов, относящих объект к каждому из классов:
(1) ;
(2) ;
(3) ;
Что из ниже перечисленного не является типом латентной модели?
(1) ко-кластеризация;
(2) матричная факторизация;
(3) двухступенчатая симметризация;
(4) семантический анализ.
Что является элементами кластеров?
(1) Векторы документов с эмпирическими распределениями .
(2) Центры псиматических кластеров.
(3) Порождающее распределение Дирихле.
(4) Степень разреженности векторов , порождаемых распределением .
Выберите правильный ответ. По контрольной выборке вычисляется:
(1) контрольная выборка
(2) эмпирическая оценка среднего риска
(3) тестируемый алгоритм
(4) уровень сложности алгоритма
Какая форма является TD-ошибкой?
(1) ;
(2) ;
(3) .
Если объекты описываются числовыми признаками , тогда:
(1) Непараметрическая оценка плотности в точке записывается в следующем виде:
(2) Точечное ядро при единичной ширине окна соответствует
(3) сходится к при для почти всех , причем скорость сходимости имеет порядок .
(4) Эмперическая оценка плотности определяется как доля точек выборки, лежащих внутри отрезка .
Небольшое число объектов с большими отрицательными отступами называют:
(1) ошибочные объекты;
(2) шумовые объекты;
(3) пограничные объекты;
(4) неинформативные объекты.
Какая функция, из ниже перечисленных, является функцией активации?
(1)
(2)
(3)
(4)
Какая функция, из ниже перечисленных, является функцией активации?
(1)
(2)
(3)
(4)
Какие объекты не являются опорными?
(1) ;
(2) ;
(3) ;
(4) .
Что называют эффективной размерностью задачи?
(1) вектор ;
(2) число главных компонент;
(3) преобразование Карупена-Лоэва;
(4) декорирующее преобразование U.
Что означает обнуление веса между скрытым и входным слоями?
(1) диагональные элементы доминируют в гессиане.
(2) после стабилизации функционала ошибки Q вектор весов w находится в локальном минимуме.
(3) информация, накопленная в сети, является полезной и не теряется при добавлении новых нейронов.
(4) m-е выходное значение не зависит от h-го нейрона скрытого слоя.
(5) h-ый нейрон скрытого слоя не будет учитывать j-й признак.
Каким способом можно избавиться от неинформативного пустого кластера?
(1) ввести ядро - неотрицательно монотонно убывающее на функцию расстояния ;
(2) ввести "механизм утомления" победителей;
(3) ввести темп обучения.
Оценка расстояний между двумя распределениями с помощью расстояния Хелингера будет выглядеть:
(1) ;
(2) ;
(3) .
Какой тип экспериментального исследования имеет цель - либо решение конкретной прикладной задачи, либо выявление «слабых мест»?
(1) исследование задач ранжирования
(2) исследование на реальных данных
(3) исследование на модельных данных
Что из ниже перечисленного является достоинством алгоритма AdaBoost?
(1) По мере увеличения числа базовых алгоритмов обобщающая способность может улучшаться;
(2) Склонен к переобучению при наличии значительного уровня шума в данных;
(3) Требует достаточно длинных обучающих выборок;
(4) Простота реализации;
(5) Возможность идентифицировать объекты, являющиеся шумовыми выбросами;
(6) Бустинг может приводить к построению громоздких композиций, состоящих из сотен алгоритмов
Что получается на выходе при построении 2-х базовых алгоритмов?
(1) - допустимое число ошибок;
(2) - пороговое значение функции потерь;
(3) - обучающая выборка;
(4) - исходный вектор весов объектов;
(5) - начальное приближение одного из базовых алгоритмов.
(6) композиция вида: .
Действительно ли то, что ёмкость однопараметрического семейства может быть бесконечной?
(1) Да
(2) Нет
Что должно поступать на вход в алгоритме жадного добавления?
(1) множество F;
(2) выборка ;
(3) критерий Q;
(4) параметр d;
(5) вещественный параметр;
(6) параметр В;
(7) Т-число поколений.
Какой алгоритм пытается улучшить конъюнкцию , удаляя или заменяя по одному терму?
(1) процедура стабилизации;
(2) процедура редукции;
(3) генетический алгоритм синтеза конъюнкций;
(4) поиск информативных конъюнкций.
Что делает конъюнкция в алгоритме КОРА, если она выделяет слишком мало объектов своего класса?
(1) перестает наращиваться;
(2) начинает удалять объекты;
(3) добавляет новые объекты;
(4) переносит объект в другой класс.
Что из ниже перечисленного является Е-шагом ЕМ-алгоритма?
(1) ;
(2) ;
(3) .
Какая компонента, из ниже перечисленных, является шумовой компонентой?
(1) ;
(2) ;
(3) .
В формуле совместной плотности функцией апостеорной вероятности класса будет функция:
(1)
(2)
(3)
(4)
(5)
Какая идея, из ниже перечисленных, описывает метод Уоткинса?
(1) применение - меода прогнозирования, к парам состояние - действие вместо просто действий;
(2) принимать в расчет только те будущие действия, которые предшествуют следующему исследовательскому действию;
(3) использовать алгоритм с одним следом приемлемости для каждого состояния.
Плотность распределения на имеет вид смеси распределений , где - это:
(1) функция правдоподобия -ой компоненты смеси;
(2) априорная вероятность функции правдоподобия
(3) вектор параметров
(4) -й столбец матрицы
(5) порог
Какие входные данные нужны для карт Кохонена?
(1) количество побед m;
(2) обучающая выборка;
(3) характеристика C=0.1;
(4) темп обучения;
(5) количество слоёв.
По какой из формул параметрическое семейство Ф можно отнести к параметрическому семейству полуплоскостей?
(1) ;
(2) ;
(3) .
Как называют априорную вероятность вида: ?
(1) робастной;
(2) тематической;
(3) фоновой;
(4) шумовой.
Идея EM-алгоритма с последовательным длбавлением компоненты заключается в следующем:
(1) при слишком узком окне плотность концентрируется вблизи обучающих объектов, при слишком широком окне плотность чрезмерно сглаживается и в пределе вырождается в константу.
(2) задаются функции правдоподобия и априорные вероятности . Согласно распределению генерируются 2 выборки: обучающая и контрольная . По обучающей выборке настраивается тестируемый алгоритм . По контрольной выборке вычисляется эмпарическая оценка среднего риска.
(3) имея некоторый набор компонент, можно выделить объекты , которые хуже всего описываются смесью - это объекты с наименьшими значениями правдоподобия . По этим объектам строится еще одна компонента. Затем она добавляется в смесь и запускаются EM - итерации, чтобы новая компонента и старые "притёрлись друг к другу". Так продолжается до тех пор, пока все объекты не окажутся покрыты компонентами.
(4) искусственно вводится вспомогательный вектор скрытых переменных , обладающий 2-мя свойствами: первое - он может быть вычислен, если известны значения вектора параметров ; второе - поиск максимума правдоподобия сильно упрощается, если известны значения скрытых переменных.
Как выглядет формула стресса в задаче многомерного шкалирования?
(1) ;
(2) ;
(3) .
Какой входной набор данных является лишним для жадного алгоритма построения решающего списка?
(1) Максимальное допустимое число отказов.
(2) Максимальная допустимая доля ошибок на обучающей выборке.
(3) Минимальная допустимая информативность правил в списке.
(4) Множество элементарных предикатов.
(5) Параметр критерия останова.
(6) Максимальное число итераций.
Что из ниже перечисленного не определяет метаинформацию?
(1) список авторов , документа d;
(2) список документов , на которые ссылается d;
(3) список категорий рубрикатора;
(4) ссылки и гиперссылки;
(5) тематические наборы документов;
(6) список тематик и словарей.
Константы смеси имеют -мерные нормальные распределения с параметрами , где - это:
(1) вектор матожидания;
(2) ковариационная матрица;
(3) диагональная матрица;
(4) объекты выборки .
Верно ли, что при n=2 многомерное шкалирование позволяет отобразить выборку в виде множества точек на плоскости?
(1) Да
(2) Нет
Что, из ниже перечисленного принято решать достоинством решающего списка?
(1) простота классификации;
(2) обученное по выборке правило классификации можно выполнять "вручную";
(3) возможность обработки разнотипных данных с пропусками;
(4) если множество правил Ф выбрано неудачно, список может не построится;
(5) каждый объект классифицируется только одним правилом.
Что характеризует гипотеза условной независимости вида: ?
(1) распределение слов полностью определяется тематикой документа и не зависит от самого документа и его классов;
(2) тематика документа d зависит не от самого документа, а только от того, каким классам он принадлежит;
(3) классификация документа d зависит не от самого документа, а только от его тематики;
(4) ничто из выше перечисленного не является характеристикой гипотезы условий независимости.
При каком условии в субквадратичном алгоритме многомерного шкалирования все точки будут "скелетными"?
(1) ;
(2) ;
(3) ;
(4) если треугольник жёстко задан длинами своих сторон.
Что такое решающий список?
(1) алгоритм классификации, основанный на поиске конъюктивных закономерностей;
(2) алгоритм классификации , который задается набором закономерностей приписанных к классам соответственно;
(3) алгоритм классификации, покрывающий набором закономерностей.
Какие модели, из ниже перечисленных относятся к многоязычным тематическим моделям?
(1) паралельные тексты;
(2) тематическая модель цитирования авторов;
(3) модель с непрерывным временем;
(4) модель с медленно меняющейся тематикой;
(5) регуляризация матрицы перевода слов;
(6) марковские модели синтаксиса языка.
Эмпирической оценкой плотности является функция:
(1)
(2)
(3)
(4)
Весовой функцией является функция:
(1)
(2)
(3)
(4)
Как называется функция ?
(1) вектор параметров;
(2) дискриминантной;
(3) линейная;
(4) параболическая.
Как называется функция ?
(1) вектор параметров;
(2) дискриминантной;
(3) линейная;
(4) параболическая.
Действительно ли что, ширина полосы минимальна, когда норма вектора w минимальна?
(1) Да
(2) Нет
Какая функция позволяет говорить о "близости" объектов, на множестве ?
(1) ;
(2)
(3)
(4)
Как выглядит гессиан функционала Q в точке ?
(1)
(2)
(3)
(4)
Какой алгоритм удаляет, те связи, к изменению которых функционал Q наименее чувствителен?
(1) алгоритм кластеризации;
(2) алгоритм backpropagation;
(3) алгоритм OBD.
Верно ли, что при частичном обучении можно получить метки зная все ?
(1) Да
(2) Нет
Что называют данными в машинном обучении?
(1) матрицы
(2) объекты
(3) признаки
(4) алгоритм
(5) функция
В каком алгоритме встречается алгоритмический оператор ?
(1) в алгоритмах кластеризации;
(2) в алгоритмах суперпозиции ;
(3) в базовых алгоритмах
Какой алгоритм предпочтительней, когда признаков больше, чем объектов?
(1) Бустинг;
(2) Беггинг;
(3) RSM.
Как будет выглядеть индикатор ошибки в случае классификации при конечном Y?
(1) ;
(2) ;
(3) ;
(4) .
Что называют выбором структуры модели?
(1) описание искомого алгоритма как суперпозиции некоторых элементарных функций;
(2) поиск преобразования исходящего пространства признаков в новое пространство существенно меньшей размерности;
(3) когда по мере увеличения числа используемых признаков средняя ошибка на обучающей выборке монотонно убывает;
(4) когда средняя оценка на независимых контрольных данных сначала уменьшается, затем проходит через точку минимума и далее только возрастает.
Как называется алгоритм, который последовательно удаляет избыточные признаки?
(1) Add;
(2) Bootstrap;
(3) FullSearch;
(4) Del
Что является выходными данными в алгоритме синтеза бинарного решающего дерева ?
(1) обучающая выборка;
(2) множество элементарных предикатов;
(3) корневая вершина дерева;
(4) максимальный ранг конъюнкций;
(5) ограничение на число конъюнкций .
Задача выявления содержательно интерпретируемых латентных характеристик клиентов и ресурсов относится к задаче коллаборативной фильтрации?
(1) Да
(2) Нет
Что из ниже перечисленного не относится к вероятностной модели коллекции документов?
(1) ;
(2) ;
(3) ;
(4) .
Этап тестирования - это:
(1) минимизация эмпирического риска
(2) алгоритм для новых объектов выдаёт ответы .
(3) метод по выборке строит алгоритм
(4) отображение вида , которое произвольно выборке ставит в соответствии некоторый алгоритм .
Что из ниже перечисленного не является элементом обучения с подкреплением?
(1) стратегия;
(2) функция поощрения;
(3) функция ценности;
(4) модель поведения;
(5) характеристика.
Верно ли утверждение. Наивный байесовский классификатор может быть как параметрическим, так и непараметрическим.
(1) Да
(2) Нет
Выберите какие недостатки относятся не к алгоритму ближайшего соседа?
(1) неустойчив к шуму при ;
(2) низкое качество классификации;
(3) отсутствие параметров, которые можно было бы настраивать по выборке;
(4) достигается максимум сразу на нескольких классах;
(5) неустойчив к погрешностям.
Пусть есть задача с 2-мя классами . К какому классу будет относится алгоритм, если ?
(1) +1;
(2) -1;
(3) 0;
(4) к ни какому из перечисленных.
Пусть есть задача с 2-мя классами . К какому классу будет относится алгоритм, если ?
(1) +1;
(2) -1;
(3) 0;
(4) к ни какому из перечисленных.
Какое условие называют опорным вектором?
(1) ;
(2) ;
(3) и .
На что влияет выбор ядра K?
(1) на точность аппроксимации;
(2) на степень гладкости функции
(3) на качество восстановления зависимости.
Выражение для гессиана будет выглядеть:
(1)
(2)
(3)
Что, из ниже перечисленного, не относится к целям кластеризации?
(1) упрощение дальнейшей обработки данных;
(2) сокращение объема хранимых данных;
(3) построение иерархии множества объектов;
(4) распределение обучающего множества на несколько классов;
(5) упрощение входных параметров.
Если есть два существенно различных метода обучения использующих разные наборы признаков, то это алгоритм:
(1) co-learning
(2) co-training
(3) self-traning
(4) OBD
Выберите правильный ответ. Задача ранжирования - это:
(1) множество объектов, разделенных на классы
(2) исследование влияние одного или нескольких признаков на объект
(3) определение порядка признака согласно рангу
Как называются операторы при фиксированном решающем правиле?
(1) базовым алгоритмом;
(2) алгоритмической композицией;
(3) алгоритмом суперпозиции;
(4) оценкой расстояния.
Какие параметры участвуют в алгоритмической композиции CCEL?
(1) максимальное число поколений;
(2) порог качества базовых алгоритмов на контроле;
(3) размер основной популяции;
(4) порог качества базовых алгоритмов на обучении;
(5) размер промежуточной популяции;
(6) длина признакового подописания;
(7) размер элиты, переходящей в следующее поколение без изменений;
(8) длина обучающих подвыборок.
Что называют методом обучения?
(1) переобученностью алгоритма на паре выборок ;
(2) ;
(3) отображение , которое произвольной конечной обучающей выборке ставит в соответствие определенный алгоритм ;
(4) индикатор ошибки.
Что называют выбором метода?
(1) параметрическое семейство отображений А, из которого выбирается искомый алгоритм ;
(2) отображение , которое произвольной обучающей выборке ставит в соответствие некоторый алгоритм из заданной модели алгоритмов А;
(3) в заданном множестве методов обучения М найти метод , выдающий алгоритмы с наилучшей обобщающей способностью.
Как будет называться закономерность , если ?
(1) логической -закономерностью для класса ;
(2) непротиворечивой;
(3) частичной.
Что, из ниже перечисленного является определением критерия замены?
(1) Сокращение числа ошибок на контрольной выборке, отобранной заранее, и не участвовавшей в обучении дерева.
(2) Заменяет отдельные вершины либо одной из дочерних вершин, либо терминальной вершиной.
(3) Заменяет поддерево вершины поддеревом левой дочерней вершины .
(4) Сохраняет поддерево вершины v.
Выберите верное определение коллаборативной фильтрации.
(1) набор методов для решения задач персонализации и анализа клиентских сред;
(2) оценивание профилей клиентов и объектов;
(3) оценивание функций сходства между клиентами и ресурсами.
Что означает запись ?
(1) Длину документа в терминах.
(2) Число вхождений термина w во все документы коллекции.
(3) Длину коллекции в терминах.
Апостеорной вероятностью класса для объекта называется:
(1) условная вероятность ;
(2) штраф не правильно соотнесенных классов;
(3) ожидаемая величина потери при классификации объектов алгоритмом
(4) вероятность потери
Как называется метод, который применяют для оценивания ценности?
(1) жадным методом;
(2) метод среднего выборочного;
(3) softmax-метод.
Есть гипотеза, где классы имеют -мерные гауссовские плотности: , где - , то ковариационной матрицей класса будет:
(1)
(2)
(3)
(4)
К какому алгоритму можно отнести формулу: ?
(1) ЕМ-алгоритм;
(2) алгоритм ближайшего соседа;
(3) алгоритм ближайших соседей;
(4) алгоритм взвешенных ближайших соседей.
Правильнее и надежнее классификация объекта будет, если:
(1) отступ меньше;
(2) отступ больше;
(3) отступа не существует;
(4) отступа не существует;
Правильнее и надежнее классификация объекта будет, если:
(1) отступ меньше;
(2) отступ больше;
(3) отступа не существует;
(4) отступа не существует;
Какие объекты называются нарушителем?
(1) ;
(2) ;
(3) .
При каком размере окна h функция в пределе вырождается в константу?
(1) при слишком широком;
(2) при слишком узком;
(3) при оптимальном значении ширины окна;
(4) при h=0.
Что представляет собой матрица ?
(1) матрицу признаковых описаний объектов;
(2) диагональную матрицу весов объектов;
(3) взвешенную матрицу признаковых описаний объектов;
(4) взвешенный вектор ответов.
С помощью какой формулы решается задача исключающего ИЛИ?
(1) ;
(2) ;
(3) ;
(4) .
Какая из формул позволит решить задачу с помощью алгоритма co-learning?
(1)
(2)
(3)
Что является квадратичной ошибкой для задачи регрессии?
(1)
(2)
(3)
Что из ниже перечисленного не относится к корректирующим операциям?
(1) простое голосование;
(2) взвешенное голосование;
(3) голосование по старшинству;
(4) метод стохастического градиента;
(5) обучение по Хеббу;
(6) правило мягкой конкуренции.
Какой метод представляет собой итерационный процесс смены поколений?
(1) RSM;
(2) Беггинг;
(3) CCEL.
Как определяется следующий функционал ?
(1) как вероятность частоты ошибок на контроле превышающее заданное число;
(2) как средняя частота ошибок на контрольных выборках;
(3) как величину переобучения.
Определите название данной задачи: имеется метод обучения использующий только признаки из заданного набора признаков . Требуется найти набор признаков, при котором алгоритм имеет наилучшую обобщающую способность.
(1) задача выбора модели;
(2) задача настройки гиперпараметра;
(3) задача отбора признаков.
По какой формуле определяется энтропия?
(1) ;
(2) ;
(3) ;
(4) .
Какой алгоритм строит набор конъюнктивных закономерностей?
(1) алгоритм простого голосования;
(2) алгоритм взвешенного голосования;
(3) алгоритм КОРА;
(4) алгоритм ТЭМП.
Какая запись соответствует числу троек, связанных с темой t?
(1) ;
(2)
(3)
Если известны и , то минимум среднего риска не будет достигнут при:
(1)
(2)
(3)
Какое условие, из ниже перечисленных, должно выполнятся, чтобы обеспечить достаточную величину шага, позволяющую справится с начальными условиями?
(1) ;
(2) ;
(3) ;
(4) при всех .
Верно ли, что если классы имеют нормальные функции правдоподобия, то байесовское решающее правило имеет квадратичную разделяющую поверхность.
(1) Да
(2) Нет
(1) при алгоритм ближайших соседей неустойчив к шуму;
(2) при алгоритм ближайших соседей вырождется в константу;
(3) алгоритм ближайшего соседа устойчив к погрешностям;
(4) алгоритм ближайшего соседа имеет парметры, которые настраиваются по выборке.
Какая, из перечисленных ниже функций, соответствует алгоритму бустинга Ada Boost?
(1) квадратичная;
(2) сигмоидная;
(3) кусочно-линейная;
(4) логистическая;
(5) экспоненциальная.
Какая, из перечисленных ниже функций, соответствует алгоритму бустинга Ada Boost?
(1) квадратичная;
(2) сигмоидная;
(3) кусочно-линейная;
(4) логистическая;
(5) экспоненциальная.
Если объекты либо лежат внутри разделяющей полосы, но классифицируются правильно , либо попадают на границу классов , либо вообще относятся к чужому классу , то их называют:
(1) периферийными;
(2) опорными;
(3) нарушителями.
Вычисление оценки скользящего контроля на каждом объекте выглядит следующим образом:
(1)
(2)
(3)
(4)
Что, из ниже перечисленного, не подается на вход в алгоритме IRLS?
(1) матрица "объекты-признаки" и вектор ответов;
(2) обучающая выборка;
(3) обучающая выборка и дискриминантная функция.
Что называют многослойной сетью?
(1) сеть, которая имеет больше одного слоя;
(2) сети, которые способны решить задачу XOR;
(3) сеть, которая имеет 3 слоя.
Какой алгоритм имеет такое условие, что пока есть путь между двумя вершинами разных классов, то удалить самое длинное ребро на этом пути?
(1) алгоритм кратчайшего незамкнутого пути;
(2) алгоритм кластеризации;
(3) алгоритм частичного обучения;
(4) алгоритм co-training.
Верно ли утверждение? Всякая оптимизация по неполной информации и избыточная сложность параметров приводит в переобучению.
(1) Да
(2) Нет
Какой пример, из ниже перечисленных, является примером смеси алгоритмов?
(1) ;
(2) ;
(3) ;
(4) .
Как называется операция, отбирающая наиболее адаптивных индивидов популяции в алгоритме CCEL?
(1) селекция ;
(2) инициализация ;
(3) рекомбинация ;
(4) мутация ;
(5) вклад .
Как будет выглядеть формула вероятности ошибки в интерпретации обобщающей способности метода , если взять матожидание по выборке от функционала ?
(1) ;
(2) ;
(3) ;
(4)
Как называется критерий, который характеризует качество метода по тем данным, которые не использовались в процессе обучения?
(1) внутренним критерием;
(2) ошибкой обучения;
(3) внешним критерием;
(4) минимизацией эмпирического риска.
Что, из ниже перечисленного характеризует взвешенную информативность?
(1) ;
(2) ;
(3) ;
(4) .
Что, из ниже перечисленного является достоинством алгоритма бустинга?
(1) алгоритм способен не только классифицировать объекты, но и объяснять свои решения на языке, понятном специалистом;
(2) при малых , алгоритм очень эффективен;
(3) решает поставленную задачу за операций;
(4) параметр позволяет управлять жадностью алгоритма;
(5) корректность на обучающей выборке гарантируется при достаточно слабыхдополнительных ограничениях;
(6) можно использовать любое семейство базовых предикатов Ф.
Какие данные являются выходными в алгоритме двухступенчатой симметризации?
(1) профили клиентов;
(2) профили ресурсов;
(3) матрица кросс-табуляции ;
(4) число тем;
(5) число итераций на внешнем цикле .
Какое обозначение соответствует задаче приближенного представления заданной матрицы частот?
(1)
(2)
(3)
Формула параметрического оценивания плотности может выглядеть как:
(1)
(2)
(3)
Что называется вероятностями перехода?
(1) задание обучения с подкреплением, удовлетворяющее марковскому свойству;
(2) пространства состояний и действий, которые являются конечными;
(3) при заданном состоянии s и действии a вероятность каждого возможного следующего состояния s'.
Если при переобучении: на всё хорошо, на всё плохо, то это проявление:
(1) вероятностного распределения
(2) гаусовского распределения
(3) мультиколлинеарности
(4) байесовского решающего правила
Какой получится алгоритм, если определить как наибольшее число, при котором ровно ближайших соседей объекта получают нулевые веса: .
(1)
(2)
(3)
(4)
В формуле , что будет выступать в роли гиперпараметра?
(1) ;
(2) ;
(3) ;
(4) .
В формуле , что будет выступать в роли гиперпараметра?
(1) ;
(2) ;
(3) ;
(4) .
Действительно ли, что построение адекватного ядра является искусством и, как правило, опирается на априорные знания о предметной области?
(1) Да
(2) Нет
Если используется квартическое ядро , где - медиана вариационного ряда ошибок, то это называют:
(1) робастными;
(2) жесткой фильтрацией;
(3) мягкой фильтрацией;
(4) скользящими.
Набор функций будет называться замкнутым относительно функции , если:
(1) для любых различных существует функция такая, что ;
(2) для любого выполено ;
(3) на произвольном компакте X можно приблизить не только многочленом от исходных переменных, но и многочленом от любого конечного набора функций F, разделяющие точки.
Что будет градиентным шагом в формуле ?
(1) ;
(2) ;
(3) ;
(4) ;
(5) .
За что штрафует функция потерь ?
(1) за уменьшение отступа;
(2) за попадание объекта внутрь разделяющей полосы;
(3) за отображение результата многомерного шкалирования.
В задачах классификации признаки могут быть строковыми, вещественными, числовыми.
(1) Да
(2) Нет
Как называют произведения в смесях алгоритмов?
(1) выпуклой комбинацией базовых алгоритмов;
(2) голосование по большинству;
(3) квазилинейной комбинацией базовых алгоритмов;
(4) компонентами смеси.
Что такое мутация (П) в методе CCEL?
(1) генетическая операция, производящая случайные изменения в индивидах популяции П;
(2) функции, оценивающие вклад популяции в композицию;
(3) генетическая операция, порождающая новых индивидов путем попарного скрещивания индивидов популяции П;
(4) генетическая операция, отбирающая N наиболее адекватных индивидов популяции П.
Если алгоритмы a и a' допускают ошибки на одних и тех же объектах, то их называют:
(1) неразличимыми на выборке ;
(2) индикатором ошибок;
(3) средней частостой ошибок.
Как называется критерий, для которого выборка случайным образом разбивается на q непересекающихся блоков одинаковой длины ?
(1) контроль по случайным подвыборкам;
(2) контроль по q блокам;
(3) бутстрап.
Какая формула характерна, если представляет количественный признак?
(1) ;
(2) ;
(3) ;
(4) .
При каком условии множество будет называться тестом?
(1) если любое его собственное подмножество не является представительным набором;
(2) если для любых из ;
(3) если каждой закономерности соответствует не подмножество признаков, а подмножество метрик;
(4) если алгоритм правильно классифицирует объект .
Что из ниже перечисленного не относится к латентной модели?
(1) хранение всей исходной матрицы данных ;
(2) сходство клиентов;
(3) оценивание профилей и клиентов;
(4) хранение профилей вместо хранения ;
(5) сходство объектов.
Как будет называться модель, в которой учитывается 11 слов?
(1) униграммной;
(2) биграммной;
(3) триграммной;
(4) n-граммной.
Если байесовское решающее правило написать через апостериорные вероятности, то получится формула вида:
(1)
(2)
(3)
(4)
Какую функцию называют функцией ценности действия для стратегии ?
(1) ;
(2) ;
(3) ;
(4) ;
(5) .
Чтобы использовать расстояние Махаланобиса в задаче определения принадлежности заданной точки одному из классов, нужно найти матрицы ковариации всех классов.
(1) Да
(2) Нет
Что, из нижк перечисленного, можно назвать достоинством метода потенциальных функций?
(1) эффективен, когда обучающие объекты поступают потоком;
(2) медленно сходится;
(3) не настраиваются параметры ;
(4) высокое качество классификации.
Верно ли утверждение? Метод SG позволяет настраивать веса на избыточно больших выборках, за счет того, что случайной подвыборки может оказаться достаточно для обучения.
(1) Да
(2) Нет
Верно ли утверждение? Метод SG позволяет настраивать веса на избыточно больших выборках, за счет того, что случайной подвыборки может оказаться достаточно для обучения.
(1) Да
(2) Нет
Что, из ниже перечисленного, является выходными данными в последовательном методе активных ограничений?
(1) точка ;
(2) ;
(3) C;
(4) параметр ;
(5) параметр .
Что будет называться псевдообратной для прямоугольной матрицы F?
(1)
(2)
(3)
(4)
Какие будут входные данные, если сеть обучать методом обратного распространения ошибки?
(1) обучающая выборка ;
(2) число нейронов в скрытом слое;
(3) темп обучения;
(4) характеристика.
Когда появляется неинформативный пустой кластер при конкурентном обучении по правилу WTA?
(1) при случайной инициализации весов;
(2) когда нейрон скрытого слоя не является нейроном-победителем;
(3) если центры кластеров взаимно однозначно соответствуют нейронам скрытого слоя.
Действительно ли, что метод XR слабо чувствителен к выбору ?
(1) Да
(2) Нет
Какие задачи, из ниже перечисленных, являются задачами прогнозирования?
(1) математический прогноз даты сильных землетрясений;
(2) определение длительности и исхода заболевания;
(3) обнаружение спама;
(4) прогнозирование вероятности летельного исхода;
(5) задачи поискового вывода.
Чему эквивалентна минимизация функционала по базовому алгоритму ?
(1) ;
(2) ;
(3) ;
(4)
Действительно ли, что RSM выполняется строго последовательно не допуская эффективного распространения?
(1) Да
(2) Нет
Что называют размерностью Вапника-Червоненкиса?
(1) максимальное значение коэффициента разнообразия по всем возможным выборкам длины L;
(2) число h такое, что и ;
(3) подвыборка из , где выполняется .
Как называется критерий ?
(1) информационный критерий Акаике;
(2) байесовский информационный критерий;
(3) критерий Вапника-Червоненкиса.
Выберите верное утверждение:
(1) Максимальный ранг конъюнкций обычно устанавливают от 3 до 7.
(2) Поиск информативных конъюнкций требует полного перебора.
(3) На выходе в алгоритме жадного слияния зон получается желаемое количество зон .
(4) На выходе в алгоритме "градиентного" синтеза конъюнкции имеем порого ошибок для отбора конъюнкций.
Верно ли, что если правило , то объект будет определен в другом классе?
(1) Да
(2) Нет
Что из ниже перечисленного не относится к недостаткам тривиальной рекомендующей системой?
(1) не учитываются интересы конкретного пользователя;
(2) проблема "холодного старта";
(3) надо хранить всю матрицу F;
(4) нечего рекомендовать новым пользователям.
Как называется технология основанная на правилах морфологии языка?
(1) лемматизацией;
(2) униграммной;
(3) стеммингом.
Общий вид равновероятных классов будет выглядеть:
(1)
(2)
(3)
(4)
(5)
Какой метод усредняет выгоды, соответствующие только первым посещениям s?
(1) МК - метод всех посещений;
(2) МК - метод первого посещения;
(3) метод поддерживающего изучения;
(4) МК - метод классической итерации.
Чему соответствует прямоугольное ядро
(1)
(2)
(3)
(4)
В зависимости от значений отступа обучающие объекты условно делятся на:
(1) 2 типа;
(2) 3 типа;
(3) 4 типа;
(4) 5 типов;
(5) 6 типов.
Что называют в теории нейронных сетей сокращением весов?
(1) квадратичную регуляризацию;
(2) нормализацию признаков;
(3) стохастический градиент;
(4) распределение Лапласа.
Что называют в теории нейронных сетей сокращением весов?
(1) квадратичную регуляризацию;
(2) нормализацию признаков;
(3) стохастический градиент;
(4) распределение Лапласа.
Действительно ли, что метод INCAS позволяет решать задачи, в которых нет линейной разделимости?
(1) Да
(2) Нет
Каким способом можно уменьшить норму вектора коэффициентов?
(1) добавить функционал Q, который штрафует большие значения нормы вектора весов ||a||;
(2) добавить диагональную матрицу ;
(3) добавить параметр
(4) умножив на собственные векторы.
Верно ли что, если обучающая выборка имеет большой объем, то можно использовать метод Хебба?
(1) Да
(2) Нет
Какое правило означает следующая формула ?
(1) правило мягкой конкуренции WTH;
(2) правило жесткой конкуренции WTA;
(3) правило справедливой конкуренции CWTA.
Верно ли, что оценить вероятность можно, только с помощью эмпирической оценкой по различным данным?
(1) Да
(2) Нет
Какие, из ниже перечисленных задач, являются задачами классификации?
(1)
(2)
(3)
(4)
(5)
Чему способствует увеличение параметра ?
(1) к переупрощению композиции за счёт увеличения числа ошибок;
(2) к ошибке всей композиции;
(3) росту числа ошибок;
(4) росту числа базовых алгоритмов.
Что, из ниже перечисленного называют компонентами смеси?
(1) ;
(2) ;
(3) ;
(4) .
Функция роста множества всех конъюнкций ранга не выше K будет выглядеть как:
(1) ;
(2) ;
(3) .
Верно ли, что по мере увеличения сложности модели внутренний критерий возрастает?
(1) Да
(2) Нет
Какие входные данные являются лишние в алгоритме жадного слияния зон?
(1) признак ;
(2) -выделенный класс;
(3) ;
(4) - желаемое количество зон;
(5) - начальное приближение;
(6) - максимальное число итераций;
(7) - параметр критерия останова.
Определите какая из формул не участвует ни в простом ни взвешенном голосовании:
(1) ;
(2) ;
(3) ;
Являются ли вероятностные модели типом латентных моделей?
(1) Да
(2) Нет
Что определяет векторный параметр ?
(1) Векторы документов с эмпирическими распределениями .
(2) Центры псиматических кластеров.
(3) Порождающее распределение Дирихле.
(4) Степень разреженности векторов , порождаемых распределением .
Выберите правильный ответ. Эмперическая оценка среднего риска вычисляется по:
(1) контрольной выборке
(2) случайной величине
(3) тестируемому алгоритму
(4) уровню сложности алгоритма
Какую величину называют относительной ценностью?
(1) ;
(2) ;
(3) .
Чему соответствует точечное ядро при единичной ширине окна :
(1)
(2)
(3)
(4)
Отрицательные отступы и классифицирующиеся неверно имеют:
(1) ошибочные объекты;
(2) шумовые объекты;
(3) пограничные объекты;
(4) неинформативные объекты.
Что, из ниже перечисленного, является функцией активации?
(1)
(2)
(3)
(4)
(5)
Что, из ниже перечисленного, является функцией активации?
(1)
(2)
(3)
(4)
(5)
Какие объекты являются опорными?
(1) ;
(2) ;
(3) ;
(4) .
Что показывает величина ?
(1) какая доля информации теряется при замене исходных признаковых описаний длины n на более короткие описания длины m;
(2) значение m, при котором происходит резкий скачок: , при условии, что уже достаточно мало;
(3) проекцию на главные компоненты;
(4) эффективную размерность задачи.
Процесс упрощения сети, в алгоритме OBD, останавливается, когда:
(1) внутрений критерий стабилизируется;
(2) заданный внешний критерий начинает возрастать;
(3) градиентный алгоритм находит новый локальный минимум Q;
(4) информация, накопленная в сети, является полезной и не теряется при добавлении новых нейронов.
Что означает в правиле справедливой конкуренции CWTA?
(1) количество побед m-го нейрона в ходе обучения;
(2) темп обучения;
(3) неотрицательная монотонно убывающая на функция.
Оценка расстояний между двумя распределениями с помощью дивергенции Кульбака-Лейблера будет выглядеть:
(1) ;
(2) ;
(3) .
Что, из ниже перечисленного, не относится к типу экспериментального исследования?
(1) исследование задач ранжирования
(2) исследование на реальных данных
(3) исследование на модельных данных
Что объясняет эффективность бустинга?
(1) по мере добавления базовых алгоритмов увеличиваются отступы обучающих объектов ;
(2) выбирается тот класс, в котором осталось больше непокрытых объектов;
(3) увеличение повышает качество базовых алгоритмов;
(4) композиции можно периодически возвращаться к ранее построенным алгоритмам и обучать их заново, что приводит к улучшению.
Что будет на выходе в алгоритме M2E?
(1) - допустимое число ошибок;
(2) - пороговое значение функции потерь;
(3) - обучающая выборка;
(4) - исходный вектор весов объектов;
(5) - начальное приближение одного из базовых алгоритмов.
(6) композиция вида: .
Верно ли утверждение, что ёмкость семейства линейных решающих правил А равна размерности пространства n?
(1) Да
(2) Нет
Что должно поступать на вход в алгоритме поочередного добавления и удаления?
(1) множество F;
(2) выборка ;
(3) критерий Q;
(4) параметр d;
(5) вещественный параметр;
(6) параметр В;
(7) Т-число поколений.
Какой алгоритм на каждом шаге отбирает целые популяции?
(1) процедура стабилизации;
(2) процедура редукции;
(3) генетический алгоритм синтеза конъюнкций;
(4) поиск информативных конъюнкций.
На что, из ниже перечисленного, влияют параметры и ?
(1) на количество получаемых конъюнкций;
(2) на оценивание малоинформативных конъюнкций;
(3) на добавление конъюнкций в список.
Что из ниже перечисленного является функционалом качества кластеризации?
(1) ;
(2) ;
(3) .
Какая компонента, из ниже перечисленных, является тематической компонентой?
(1) ;
(2) ;
(3) .
В формуле совместной плотности функцией априорной вероятности класса будет функция:
(1)
(2)
(3)
(4)
(5)
Верно ли, что метод не принимает в расчет все будущие ситуации вплоть до конца эпизода при выполнении дублирования?
(1) Да
(2) Нет
Верно ли утверждение. Функции правдоподобия принадлежат параметрическому семейству распределений и отличаются только значениями параметра .
(1) Да
(2) Нет
Какие данные не используют в картах Кохонена в качестве входных?
(1) количество побед m;
(2) обучающая выборка;
(3) характеристика C=0.1;
(4) темп обучения;
(5) количество слоёв.
По какой из формул параметрическое семейство Ф можно отнести к параметрическому семейству областей?
(1) ;
(2) ;
(3) .
Как называют априорную вероятность вида: ?
(1) робастной;
(2) тематической;
(3) фоновой;
(4) шумовой.
Выберите верные утверждения:
(1) EM-алгоритм состоит из итерационного повторения 4-х шагов;
(2) на шаге E вычисляется ожидаемое значение вектора открытых переменных G;
(3) на шаге M вычисляется приближение вектора параметров ;
(4) задача максимизации правдоподобия решается на шаге M;
(5) алгоритм EM можно применить в задачах кластеризации и восстановления пропусков данных.
Формула гладкой аппроксимации имеет вид:
(1) ;
(2) ;
(3) .
Что получается на выходе в алгоритме жадного построения решающего списка?
(1) Максимальное допустимое число отказов.
(2) Максимальная допустимая доля ошибок на обучающей выборке.
(3) Минимальная допустимая информативность правил в списке.
(4) Множество элементарных предикатов.
(5) Параметр критерия останова.
(6) Максимальное число итераций.
(7) Решающий список .
Относится ли список ярлыков , присвоенных пользователями документу d к метаинформации?
(1) Да
(2) Нет
Радиальными функциями принято называть функции:
(1) правдоподобия классов ;
(2) зависящие только от расстояния и фиксированной точкой пространства ;
(3) плотности распределения класса
(4)
Верно ли, что при n=3 многомерное шкалирование позволяет отобразить выборку в виде множества точек на плоскости?
(1) Да
(2) Нет
Что, из ниже перечисленного является недостатком решающих списков?
(1) простота классификации;
(2) обученное по выборке правило классификации можно выполнять "вручную";
(3) возможность обработки разнотипных данных с пропусками;
(4) если множество правил Ф выбрано неудачно, список может не построится;
(5) каждый объект классифицируется только одним правилом.
Что характеризует гипотеза условной независимости вида: ?
(1) распределение слов полностью определяется тематикой документа и не зависит от самого документа и его классов;
(2) тематика документа d зависит не от самого документа, а только от того, каким классам он принадлежит;
(3) классификация документа d зависит не от самого документа, а только от его тематики;
(4) ничто из выше перечисленного не является характеристикой гипотезы условий независимости.
При каком n в карте сходства отображается результат многомерного шкалирования в виде плоского точечного графика?
(1)
(2)
(3)
(4)
(5)
Что такое бинарное решающее дерево?
(1) алгоритм классификации, основанный на поиске конъюктивных закономерностей;
(2) алгоритм классификации , который задается набором закономерностей приписанных к классам соответственно;
(3) алгоритм классификации, покрывающий набором закономерностей.
(4) алгоритм классификации, задающийся бинарным деревом, в котором каждой внутренней вершине приписан предикат , каждой терминальной вершине приписано имя класса .
Какие модели, из ниже перечисленных относятся к многомодальным тематическим моделям?
(1) коллаборативная фильтрация;
(2) персонализация рекламы в Интернете;
(3) модель с непрерывным временем;
(4) модель с медленно меняющейся тематикой;
(5) регуляризация матрицы перевода слов;
(6) марковские модели синтаксиса языка.