Учебное пособие по курсу «Нейроинформатика» | страница 50
Кодирование неупорядоченных качественных признаков
Таблица 5. Кодирование неупорядоченного качественного признака
Состояние | Вектор входных сигналов |
---|---|
α>1 | (b,a,a,…,a) |
α>2 | (a,b,a,…,a) |
α>n | (a,a,…,a,b) |
Поскольку никакие два состояния неупорядоченного признака не связаны отношением порядка, то было бы неразумным кодировать их разными величинами одного входного сигнала нейронной сети. Поэтому, для кодирования качественных признаков рекомендуется использовать столько входных сигналов, сколько состояний у этого качественного признака. Каждый входной сигнал соответствует определенному состоянию. Так если набор всех состояний рассматриваемого признака обозначить через α>1, α>2, …, α>n, то рекомендуемая таблица кодировки имеет вид, приведенный в табл. 5.
Кодирование упорядоченных качественных признаков
Таблица 6. Кодирование упорядоченного качественного признака
Состояние | Вектор входных сигналов |
---|---|
α>1 | (b,a,a,…,a) |
α>2 | (b,b,a,…,a) |
α>n | (b,b,…,b,b) |
Упорядоченные частные признаки, в отличие от неупорядоченных, имеют отношение порядка между состояниями. Однако кодирование их разными значениями одного входного сигнала неразумно из-за того, что расстояние между состояниями не определено, а такое кодирование эти расстояния задает явным образом. Поэтому, упорядоченные частные признаки рекомендуется кодировать в виде стольких входных сигналов, сколько состояний у признака. Но, в отличие от неупорядоченных признаков, накапливать число сигналов с максимальным значением. Для случая, когда все состояния обозначены через α>1 < α>2 < … < α>n, рекомендуемая таблица кодировки приведена в табл. 6.
Числовые признаки
При предобработке численных сигналов необходимо учитывать содержательное значение признака, расположение значений признака в интервале значений, точность измерения значений признака. Продемонстрируем это на примерах.
Содержательное значение признака. Если входными данными сети является угол между двумя направлениями, например, направление ветра, то ни в коем случае не следует подавать на вход сети значение угла (не важно в градусах или радианах). Такая подача приведет к необходимости «уяснения» сетью того факта, что 0 градусов и 360 градусов одно и тоже. Разумнее выглядит подача в качестве входных данных синуса и косинуса этого угла. Число входных сигналов сети увеличивается, но зато близкие значения признака кодируются близкими входными сигналами.