Компьютерра, 2008 № 34 (750) | страница 32



Идея, впрочем, не нова: похожий мобильный сервис еще в 2004 году предлагал японский филиал крупнейшего интернет-магазина Amazon (японцы все делают первыми).

Поисковая система Linkoln, которую разрабатывают в Microsoft Research, - это следующий логический шаг. Она справляется не только с машиночитаемыми кодами. Для Linkoln подойдут любые плоские изображения - например, афиши или обложки дисков.

Если картинка содержится в ее базе данных, Linkoln сможет ее отличить.

В распознавании образов видят будущее мобильной дополненной реальности и в Nokia: в прошлом году компания приобрела калифорнийский стартап PIXTO, разработавший технологию Point&Find. Теперь над нею работают в той же лаборатории, где была создана MARA. Телефон с поддержкой Point&Find выделяет на снимке, полученном с помощью встроенной камеры, характерные детали и сверяет их базой данных, хранящейся на сервере. Хотя основа технологии - распознавание образов, информация со встроенного в телефон приемника GPS тоже способна помочь делу. Если известно, где сделан снимок, круг поиска можно ограничить. По фотографии достопримечательности телефон Point&Find выдаст историческую справку и туристическую информацию, а если в объектив попадет афиша фильма, пользователь получит список ссылок на его трейлер и расписание киносеансов.

Создатели похожей системы, которую разрабатывали в Neven Vision, зашли еще дальше: их детище умеет различать не только предметы, но и людей. Впрочем, в этом нет ничего странного, если знать историю компании. Уникальная система распознавания лиц, способная работать на маломощных карманных устройствах, долгое время оставалась "дойной коровой" компании, а основатель Neven Vision Хартмут Невен считался одним из ведущих экспертов в этой области. Пять лет назад Neven Vision начала работу над адаптацией своих патентованных алгоритмов для распознавания мест и предметов и, похоже, преуспела в этом: сообщалось, что уже в 2005 году программа уверенно идентифицировала известные ей объекты и спотыкалась лишь на предметах, которые легко спутает и человек - например, она могла не уловить тонкие различия между похожими моделями сумочек. Невен говорил, что его цель - создание "визуального Google", работающего в реальном мире, а не в Интернете.

Но для этого мало иметь эффективный алгоритм распознавания. Даже если предположить, что эта задача успешно решена, остается еще одна проблема, и не меньшая, - поисковый индекс. Если он неполон, все остальные усилия бесполезны. Можно, конечно, на первых порах ограничиться малым - например, собрать базу данных по книжным обложкам или киноафишам не так уж трудно. Но что дальше? Кому под силу создать достаточно обширную базу данных мест и объектов? Разве что самому Google - и как тут не вспомнить фургончики Google StreetView, второй год колесящие по городам Америки, Японии и Европы и методично фиксирующие облик каждого дома, улицы и переулка. Кто-то уже в шутку сравнивал их с "пауками"-гуглботами, которыми поисковик индексирует сайты. И как знать, возможно, в этом сравнении есть доля правды. В конце концов, Хартмут Невен теперь тоже работает в Google.