Веревка вокруг Земли и другие сюрпризы науки | страница 53
Новые горизонты использования CAPTCHA открылись в ходе проектов по оцифровке книг, чтобы сделать их текст доступным в сети Интернет. Раньше процесс этот был весьма трудоемким и требовал, чтобы люди считывали текст и набирали его на компьютере. Позднее возникли менее затратные методы с использованием OCR (Optical Character Recognition) — программ для оптического распознавания текста, которые на высокой скорости считывают книгу и преобразуют ее в электронный документ. Однако чем старее книга, тем сложнее компьютеру распознать текст. Викторианский роман, отпечатанный мелким шрифтом на пожелтевшей и крошащейся бумаге, — твердый орешек для компьютера, в то время как у человека при чтении такой книги никаких проблем не возникает.
И тут снова на арене появляется CAPTCHA. Чтобы получить доступ к интернет-сервисам, люди вводят подобные коды более ста миллионов раз в сутки. Ученые-компьютерщики из питтсбургского университета Карнеги-Меллон показали, как можно использовать этот пустой труд, убедив владельцев некоторых сайтов использовать в качестве CAPTCHA слова, которые компьютеру не удалось распознать при оцифровке старых книг. Так, подстраховавшись, чтобы быть уверенными в правильном распознавании и использовав для этого на разных сайтах одно и то же слово, они создали систему для обработки неразборчивых слов, которые прежде требовали распознавания специалистом и введения в текст в ручном режиме. Эта система оптического распознавания текста, получившая название reCAPTCHA, во время испытаний показала точность 99,1 % (для сравнения: точность стандартной OCR — 83,5 %). За год работы этого проекта пользователи Интернета невольно расшифровали почти 500 миллионов слов, что равноценно количеству не поддающихся расшифровке слов из 17600 книг.
Так что, в следующий раз, блуждая, лазая, ползая по Интернету и столкнувшись там с кодом в виде деформированного и трудно различимого слова, изо всех сил постарайтесь разобрать его, ведь, возможно, вы не просто покупаете билет на выступление любимой группы, но еще и пополняете хранилище сокровищ мировой литературы в Интернете.
В 1890 году жителям Зальцбурга повезло — у них появилось новое лакомство, «Mozartkugeln» (в переводе на русский «шарики Моцарт»): сердцевина из фисташкового марципана под слоем нуги и темного шоколада. Традиционно эти круглые конфеты заворачивали в квадратные или прямоугольные фантики из серебристой фольги, и, конечно, часть фольги расходовалась впустую, образуя складки, неизбежные, если пытаешься обернуть шоколадный шарик плоским листком фольги.