В поисках Гордо | страница 12




* * * 

Наконец, пришла очередь Эмили занять место свидетеля. Ханна Плакстон задала ей серию отрепетированных вопросов об алгоритмах извлечения данных, открывших для человечества Ретикулум. Но потом Пётр Судейко начал перекрёстный опрос.

— Доктор Чу, — сказал он, — я был впечатлён естественностью речи Урсулы.

— Спасибо.

— Вы в самом деле проделали великолепную работу, создав ИИ-аватар инопланетянина, с помощью которого можно осуществлять поиск в Ретикулуме так же легко, как в нашей Всемирной паутине.

— Спасибо. Это была командная работа.

— Это правда поражает воображение. Я считал, что универсальная трансляция того сорта, что выполняет Урсула, невозможна. Не могли бы вы пояснить нашему достойному жюри присяжных, каким образом это было достигнуто?

— Конечно. Мы достигли первого прорыва в деле распознавания спонтанной речи в 2010 году, воспользовавшись полностью связными глубинными нейронными сетями, или ГНС. Для глубинного обучения вы даёте нейронным сетям всё новые и новые образцы, и сравнивая их, сети в конце концов догадываются о семантике слов, семантике предложений и модели знаний.

Одним из ключевых факторов оказалось понимание того, что семантическое намерение лучше определяется на уровне фразы/предложения, а не уровне отдельного слова. В конце концов, слова часто многозначны: «лук» — это овощ или метательное оружие? Но фраза или предложение, а ещё лучше документ целиком, содержат богатую контекстную информацию, которой мы можем воспользоваться. И, разумеется, целая сеть, неважно, их или наша, содержит бесчисленные розеттские камни. К примеру, есть лишь несколько способов представления периодической системы элементов, а любая технологически развитая цивилизация должна как-то это делать.

Так что наши нейронные сети просто смотрят, какие инопланетные слова часто соседствуют с изображениями каких объектов. Это статистическая игра, но если играешь в неё достаточно долго, то выигрываешь.

— Понятно. И для простых вещей оказывается довольно легко составить таблицу перевода.

— Верно. К примеру, они прислали тысячи фотографий образцов минералов, и, просматривая тексты, связанные с этими фотографиями, нейронные сети способны не только выяснить названия конкретных минералов — как на их языке называется кварц или алмаз — но и со временем догадаться об их более общих терминах, в том числе таких, что подчёркивают различия, о которых даже большинство людей не имеет понятия, как к примеру, о разнице между «горной породой» и «минералом».