Компьютерра, 2007 № 13 (681) | страница 42



Может статься, что после публикации рассматриваемая программа послужит совершенствованию методики сегрегирования живых посетителей сайтов и роботов по уровню возможности распознавания зашумленного текста. Ведь нельзя исключить, что OCR-программы уже научились решать привычные ребусы.

Иное дело — рукопись, где за всю жизнь мы даже собственный автограф не способны повторить со стопроцентной тождественностью. Потому усилия по созданию программ распознавания почерка столь велики, что должны были бы, как всякое действие, породить не только коммерческий продукт, но и противодействие.

Вектор противодействия следует искать в направлении генерации псевдорукописных шрифтов с плавающим начертанием букв. Например, шрифт может динамически меняться в зависимости от манеры набора текста на клавиатуре конкретным оператором (уверенно, импульсивно, торопливо и т. п.). Однако намеченного противодействия усилиям по распознаванию почерка в софтверной индустрии не наблюдается, что говорит как минимум об ином направлении приложения декларируемых [Например в диссертации Давида Яна, руководителя ABBYY] усилий.

Восполним пробел впереди паровоза. Программно сымитируем основное свойство рукописного текста — повторяющуюся неповторимость каждой буквы (например, "w" на рис. 1).





Из средств SnapArt лучше всего использовать для этой цели фильтр Stylize (с учетом рекомендаций из упомянутых «Основ графологии»). Опытным путем (подробнее см. публикацию «FineReader как детектор лжи» в «Домашнем Компьютере») установлена наибольшая стойкость к алгоритму OCR у контурных букв. Именно такие, нет, не шрифты, а исходники для их создания, генерирует фильтр Stylize практически из любых начертаний, сохраненных в растровом формате. Собственно, для означенной цели этих букв-картинок достаточно [Процесс создания шрифта из растровых заготовок подробно описан в материале «Чтение? Дело привычки» в «Домашнем компьютере»].





Остается отметить постпраздничную актуальность использования рассмотренного пакета фильтров по прямому назначению. Во-первых, размытые тремором рук кадры обрабатываются столь же четко, как и идеальные студийные фотографии. Во-вторых, «отдых», запечатленный «маслом» (рис. 2), смотрится гораздо изящнее документального снимка (который я даже не стану приводить в уменьшенном масштабе).

ЦФК или КПЗ?

Автор: Алексей Климов

Когда фотоаппараты стали называть «камерами», мое отношение к ним изменилось. Потому что я давно забыл оптические законы камеры-обскуры, формирующей изображение окружающего мира на своей внутренней стенке через маленький глазок в ставнях. А вот законы камеры обычной, с глазком в дверях, средства массовой информации нам ежедневно напоминают.