Учебное пособие по курсу «Нейроинформатика» | страница 17
Продифференцируем целевую функцию по неизвестным t>q, c>i>r, b>i>r и приравняем результаты к нулю.
Выразим из последнего уравнения в (10) b>i>r:
В качестве b>i можно выбрать любую точку прямой. Отметим, что для любого набора векторов x>ij и любой прямой с ненулевым направляющим вектором c>i на прямой найдется такая точка b>i, что сумма проекций всех точек на прямую x = b + tc будет равна нулю. Выберем в качестве b>i такую точку. Второе слагаемое в правой части (11) является r-й координатой суммы проекций всех точек на искомую прямую и, в силу выбора точки b>i равно нулю. Тогда получаем формулу для определения b>i:
Из первых двух уравнений (10) получаем формулы для определения остальных неизвестных:
Поиск решения задачи (4) для данного вида классификации осуществляется по следующему алгоритму:
1. Вычисляем b>i по формуле (12).
2. Вычисляем t по первой формуле в (13).
3. Вычисляем c>i по второй формуле в (13).
4. Если изменение значения c>i превышает заданную точность, то переходим к шагу 2, в противном случае вычисления закончены.
Определение числа классов
До этого момента вопрос об определении числа классов не рассматривался. Предполагалось, что число классов задано исходя из каких-либо дополнительных соображений. Однако достаточно часто дополнительных соображений нет. В этом случае число классов определяется экспериментально. Но простой перебор различных чисел классов часто неэффективен. В данном разделе будет рассмотрен ряд методов, позволяющих определить «реальное» число классов.
Для иллюстрации будем пользоваться пространственной моделью в двумерном пространстве. На рис, 10 приведено множество точек, которые будут разбиваться на классы.
Простой подбор
Идея метода состоит в том, что бы начав с малого числа классов постепенно увеличивать его до тех пор, пока не будет получена «хорошая» классификация. Понятие «хорошая» классификация может быть формализовано по разному. При простом подборе классов как правило оперируют таким понятием, как часто воспроизводящийся класс. Проводится достаточно большая серия классификаций с различным начальным выбором классов. Определяются классы, которые возникают в различных классификациях. Считаются частоты появления таких классов. Критерием получения «истинного» числа классов может служить снижение числа часто повторяющихся классов. То есть при числе классов