Младший брат | страница 74



Я ждал, пока загрузится программа, наблюдая за процессом на освещенной стене. Мне хотелось послать электронные сообщения Ванессе и Джолу, поделиться с ними своими мыслями по поводу сегодняшней истории с копами. Я уже положил пальцы на клавиши, но остановился.

У меня на душе вдруг стало очень паршиво. Почти такое же отвратное чувство я испытал в ту минуту, когда понял, что моего старого, многострадального «винегрета» завербовали в стукачи. А сейчас мне пришло в голову, что любимый мной икснет может запросто барабанить дээнбистам о местонахождении каждого из своих пользователей.

Вспомнились отцовские слова: «Сначала мы даем программе задание определить параметры среднестатистической позиции в базе данных, а затем отыскать те позиции, чьи параметры больше всего отличаются от среднестатистических».

Надежность икснета заключается в том, что его пользователи не связаны напрямую с Интернетом. Они как бы перескакивают с иксбокса на иксбокс, пока не отыщется тот, что подключен к Интернету. Тут и происходит передача информации в нечитабельном, зашифрованном виде, так что непонятно, какие из гуляющих по Интернету сообщений икснетовские, а какие всего лишь обычные банковские переводы, коммерческая корреспонденция и прочая криптованная переписка. Нет никаких концов, привязывающих интернетовский трафик к икснету и, тем более, к пользователям икснета.

Да, но как насчет упомянутой отцом «байесовой статистики»? Я довольно хорошо знаком с этим математическим приемом. Мы с Даррелом как-то взялись написать собственную фильтрующую программу против спама, а в таком деле без байесовой математики не обойтись. Британский математик Томас Байес жил в XVIII веке в полной неизвестности, и только спустя два столетия после его смерти ученые-программисты по достоинству оценили предложенный им метод статистического анализа большого объема данных. Именно с его помощью они сумели свернуть современные информационные Гималаи.

Байесова статистика работает примерно так. Скажем, ваш почтовый ящик завалило спамом. Сначала вам надо подсчитать количество повторений каждого отдельного слова во всех рекламных объявлениях. В итоге вы получите «гистограмму частотности употребления слов», которая указывает степень вероятности, что тот или иной объем словесной информации окажется спамом. Теперь проделайте то же самое с тонной е-мейла, который заведомо не спам (на профессиональном сленге его именуют «хэм», «ветчина», в отличие от «спам», названия мясных консервов, чья реклама и породила обобщающее название для всякой ненужной информации в Интернете, засоряющей электронные почтовые ящики).