Компьютерра, 2007 № 21 (689) | страница 6



В OLPC уже приняли 2,5 млн. предварительных заказов на XO и надеются, что к запуску, намеченному на сентябрь, удастся убедить правительства развивающихся стран в выгодности затеи, не в последнюю очередь за счет представления нового обучающего софта. Но помимо проблем с производственными задержками и повышением отпускной цены до 175 долларов, проекту сверхдоступного лэптопа мешает и конкуренция со стороны Intel. Координатор работ Николас Негропонте посетовал, что корпорация активно демпингует, предлагая свой Classmate PC – еще один ПК, призванный обеспечить компьютеризацию школ в слаборазвитых регионах. АЗ

С миру по капче

Все знают, что такое CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart). Это такие маленькие картинки с кривыми буквами и цифрами, которые нужно угадать, чтобы доказать, что ты живой человек, а не робот. Подобная проверка обычно используется в местах, уязвимых для спама, – например, при создании анонимных комментариев в блогах, регистрации новых адресов электронной почты и т. п. Спамеры, в свою очередь, пытаются эту защиту преодолеть, подключая системы распознавания текстов или используя социальную инженерию. Так, один веб-спамер описывал способ преодоления защиты при помощи передачи картинок посторонним пользователям. Вместо отсеивания юзеров из «ненужных» стран можно подсовывать им CAPTCHA-картинку с другого сайта под предлогом «дополнительной проверки для входа на сайт». Ничего не подозревающие пользователи распознают тексты, позволяя спамеру обделывать свои грязные делишки.

Однако та же технология может быть использована и для добрых дел. Сотрудники американского университета Карнеги-Меллона Луис фон Ан (Luis von Ahn, на фото) и Бен Маурер (Ben Maurer) запустили проект под названием reCAPTCHA. По их оценке, ежедневно люди в мире решают около 60 млн. «капч», затрачивая на это примерно девятнадцать человеко-лет. Почему бы такому гигантскому ресурсу не послужить на благо человечеству?

Вместо того чтобы вводить бессмысленные наборы букв и цифр или слова, выбранные наугад из словаря, разработчики нового метода предлагают в качестве объекта распознавания использовать изображения, текст на которых неизвестен самой системе. Поставщиком «секретных материалов» стала компания Internet Archive, знаменитая своим уникальным сервисом, позволяющим заглянуть в прошлое Сети. Архивариусы активно оцифровывают бумажные книги, а этот процесс, как известно, часто замедляется из-за неспособности OCR-системы распознать слишком потрепанные страницы. Именно нечитаемые электронным глазом слова и будут предлагаться пользователям для «ручного» перевода в цифровую форму. А для осуществления исконной функции CAPTCHA – отсева компьютерных программ – каждое такое слово следует после известного «экзаменатору». Для подтверждения гордого звания человека достаточно правильно разобрать первую картинку, а расшифровку второй система примет на веру. Правда, каждое неизвестное слово на всякий случай дается нескольким пользователям.