Удивительная история информатики и автоматики | страница 105
Тьюринг и Мичи сходились в том, что компьютер, обладающий огромной вычислительной мощью, может неимоверно увеличить силу Дональд Мичи человеческого интеллекта. Однако человек, в отличие от машины, способен обучаться. А можно ли применительно к компьютеру говорить об обучении? Они не раз обсуждали этот вопрос. Работа Мичи, выполненная около i960 года, стала одной из первых, в которых была предложена модель обучения компьютера методом проб и ошибок.
Дональд Мичи решил обучать компьютер — и обучать игре в «крестики-нолики». Возможно, имей Мичи в своем распоряжении настоящий компьютер, он предпочел бы написать программу, моделирующую процесс обучения. Но компьютера у него не было, и Мичи создал удивительное устройство — модель компьютера, состоящую из 304 спичечных коробков. Он назвал его MENACE (Match box Educable Noughts And Crosses Engine — «Обучающаяся машина из спичечных коробков для игры в «крестики-нолики»»).
Каждый коробок представлял собой одну из позиций, которые могут возникнуть в ходе партии; позиция изображалась на его крышке. Первый ход всегда был за «машиной», поэтому на коробках показывались только позиции с четным количеством символов. Коробки были наполнены бусинками девяти разных цветов, причем каждый цвет был соотнесен с одной из девяти клеток игрового поля.
Коробок, соответствующий начальной позиции (т. е. пустому игровому полю перед первым ходом), содержал по 4 бусинки каждого цвета; позиции перед третьим ходом — по 3, перед пятым ходом — по 2 и перед седьмым ходом — по одной бусинке каждого цвета. При этом число различающихся цветов в каждом коробке совпадает с числом возможных в данной позиции ходов машины.
Очередной ход машины производился так. Игрок выбирал коробок с изображением текущей позиции, брал его, тряс, чтобы хорошо перемешать бусинки, и затем открывал. Бусинка, оказавшаяся в вершине имевшейся внутри каждого коробка перегородки в виде утла, определяла следующий ход машины. Игрок вынимал эту бусинку и, оставив использованный коробок открытым, откладывал его в сторону. Затем он решал, какой сделает ход, выбирал коробок, соответствующий возникающей после этого хода позиции, и повторял описанные действия вплоть до окончания партии. Если машина проигрывала, то взятые бусинки на место не возвращались (благодаря этому вероятность сделать тот же — т. е. приведший к поражению — ход в следующих партиях уменьшалась); если партия заканчивалась вничью, все бусинки возвращались на место, т. е. состояние машины не изменялось; если машина выигрывала, то взятые бусинки возвращались на место, и, кроме того, в каждый открытый коробок добавлялись еще по одной бусинке того же цвета (это увеличивало вероятность сделать тот же ход в последующих партиях).