Стремление к совершенству | страница 2



Сначала я решил вполне локальную задачу: лишил редактора возможности надо мной издеваться этим простейшим способом. Программа, снабженная могучим словарем, выискивала все одинаковые слова и заменяла их синонимами. Все шло хорошо, но возник вопрос — какими синонимами заменять? Если, скажем, у слова десять синонимов. Один из способов — применить частотный анализ. Про каждое слово мы знаем частоту его употребления в текстах. В общих, в специальных, в «жаргонизированных», в современных, в архаичных и т. д. Поэтому можно, подбирая соответствующие синонимы, создать текст архаичный и вполне современный, общелитературный и написанный техническим языком или, скажем, молодежным (одним из молодежных) жаргоном и т. д. Более того, если мы знаем, как со временем изменяется частота словоупотребления, мы можем создать «текст будущего», используя слова, частота употребления которых в последние годы растет. Оруэлл бы перевернулся в гробу — новояз по-кибернетическому! Но шутки в сторону. Тексты, стилизованные под старину, под хиппи, под шоферское арго — все это программа делала запросто. Если на 486-й пускать, то даже покурить не успеешь — все готово. Естественный следующий шаг — имитация стиля конкретных авторов. Один и тот же текст, исполненный под «Тихий Дон» и «Поднятую целину», под Набокова и Стругацких? Маловероятно, но очень, очень похоже… Позвонить, что ли, в С.-Петербург? Или Борисову эмэйл дать?…

Однако я уже не мог остановиться. Есть в научной работе такой момент, когда задача начинает фактически диктовать ход работы, и автор, как кролик, только не фазиль-искандеровский, а натуральный, хвостик трясется и спинка вспотела, но — туда, туда, туда…

Я начал учитывать связи между словами, потом — структуру фраз. Программа уже работала ощутимое время. Трудилась, значит. И выдавала тексты. Заметим, что если параметры (частота употребления тех или иных слов, тех или иных схем) изменять мало, то тексты получались «экспертно-неразличимыми». То есть человек-эксперт читал два текста и атрибутировал их одинаково, добавляя, что это, по-видимому, разные варианты. Если же изменить параметры сильно, то тексты атрибутировались по-разному. Это, говорил эксперт с умным видом, по-видимому, Эразм Роттердамский, а это — наверное, Солженицын. Только они же оба о лесбийской любви не писали, голубчик! Ах, виноват, отвечал я, с темой неувязочка вышла. И эксперт провожал меня долгим, задумчивым взглядом… Но, что оказалось — что эксперты никогда не становились в тупик. Сначала они лихо называли век, год и автора, а потом открывали рот и вопрошали — откуда у вас это, молодой человек?! Имярек же об этом не писал?! В его веке этого же не было. Не мог Тунгусский метеорит упасть на территории Эвенкийского автономного округа!