Двуликий электронный Янус | страница 15



Уже стало привычным, что компьютеры «разговаривают». В ряде случаев они оснащаются синтезаторами речи; многим знаком «металлический» голос компьютера, отвечающего на вопрос или что-то напоминающего. Проблема создания «говорящих» ЭВМ оказалась более простой, чем их обучение «пониманию» человеческой речи и исполнению устных команд. Но и в этой области достигнуты обнадеживающие результаты. Так, в США еще в 1991 году создали программу для компьютера, позволяющую ему «читать по губам», т. е. понимать речь человека по движению его губ. Подобные устройства могут существенно облегчить работу и быт людей, а потому заслуживают широкого распространения.

Компьютеры, которые могут говорить и выполнять отданные им устно распоряжения, уже не новинка. Есть компьютеры, способные разговаривать и слушать. Собрав необходимую информацию, ЭВМ обращается к своей памяти и начинает поиск нужных сведений. Техника голосовой связи с компьютером включает синтез речи и выполнение голосовых команд, но первая задача проще. Искусственная речь образуется благодаря специальной системе, которая способна накапливать в памяти звуки, входящие в состав слов (так называемые фонемы), и различные правила их комбинаций. В нужный момент информация, поступающая из памяти, преобразуется в звуки, имитирующие человеческий голос.

Системы речевого синтеза применяются сейчас во многих областях. Фотоаппарат «Токер», например, приятным женским голосом советует, как использовать вспышку или выбрать правильное расстояние при фотографировании. Компьютер «Амиго» способен громким голосом читать текст, появляющийся на его экране. Есть модели наручных часов, сообщающих время. Всего не перечислишь.

Не следует, однако, думать, что эта техника используется только в какой-либо бытовой аппаратуре. Можно привести примеры ее промышленного применения. Система с синтезированием речи входит в состав телефонной справочной службы Нью-Йорка. Работает она следующим образом: когда поступает запрос о номере телефона, оператор с помощью ЭВМ находит нужный номер и включает механизм искусственного голоса, дважды сообщающий его запрашивающему. Сам же оператор в это время обслуживает уже другого абонента. Это сокращает время операции на 5—10 секунд. Такая система позволяет каждому работнику в течение смены ответить на 20–25 % запросов больше.

Техника опознавания голоса оказалась намного сложнее. Чтобы научить компьютер «понимать» живую речь, слова нужно преобразовать в цифровой код. Любое слово должно быть закодировано с помощью комбинаций цифр «0» и «1», которые вводятся в память машины. Когда ЭВМ получает какую-либо голосовую команду, она преобразует ее в цифровые комбинации и сопоставляет с хранящимися в памяти. Если там находится эквивалент, то компьютер выполняет действие, предусмотренное командой.