Знание-сила, 2008 № 05 (971) | страница 3
Однако прогресс не стоит на месте. На очереди новая версия Интернета — семантический Интернет. Одним из его главных энтузиастов является опять же Тим Бернерс-Ли. «Сеть 3.0» должна «понимать», о чем ее спрашивают, какой смысл вкладывает в вопрос человек. Современные компьютеры ведь невероятно глупы. Если нам и кажется, что в них мелькает проблеск мысли, то это заслуга разработчиков программы, которая вложена в компьютер.
Блестящий пример подобного «псевдоразума» — это поисковые системы, которые так охотно предоставляют нам справки о самых разных вещах. Но вот задайте «Яндексу» или «Гуглу» вопрос «Какого цвета моя синяя куртка?», и весь его интеллект мигом испарится. На экране высветятся обрывки текстов, где мелькают фразы «синяя куртка», «куртка цвета», «какие куртки», «синий цвет» и так далее. Машина даже не заметит, что ей задали вопрос.
Чтобы машина хотя бы имитировала мышление, Бернерс-Ли предложил снабдить всю информацию в Сети особыми метками — так называемыми «tags», «этикетками», универсальными идентификаторами, с помощью которых можно отсылать к категориям, соответствующим тому или иному слову. Элементарный пример: в одном случае слово «лук» должно нести метку о том, что речь идет об оружии, в другом — о растении. Слово «Столыпин» будет отсылать к термину «политик», а «Топтыгин» — это, допустим, «животное».
По мере того, как слова сетевых текстов будут обрастать подобными «этикетками», компьютер научится давать изощренные ссылки, подверстывая к той или иной дате, например, сведения о погоде в тот день, если рядом с датой указан географический пункт, и добавляя фотографии, которые соответствуют словам «солнечная погода», «дождь» или «снег». Машине не составит труда собрать исчерпывающее досье на тему «Шорские поэты ХХ века», выискивая все упоминания о В.Кадышеве, А.Бельчегешеве или С.Торбокове. Да мало ли что она сумеет теперь!
Разумеется, составление подобных ссылок очень трудоемко, поэтому 99% сайтов не охвачено пока семантическим Интернетом. Так, в Германии в октябре 2007 года Министерство экономики приступило к проекту «Тесей», рассчитанному на пять лет и предусматривающему семантическую модернизацию немецкоязычного Интернета. Бюджет проекта — 180 миллионов евро.
В берлинском Свободном университете разрабатывают еще одну версию семантического Интернета — «K-Space». Здесь пытаются научить компьютеры понимать сообщения, передаваемые, например, по радио. Для этого машина должна уметь разлагать звуковую информацию на музыку, речь и шумы, а затем преобразовывать речевые сообщения в печатный текст, снабжая слова пометкой, кем это было сказано. Со временем можно научить поисковые машины анализировать телевизионную информацию.