Чеширская улыбка кота Шрёдингера. Мозг, язык и сознание | страница 96



С акустической точки зрения звуковая речь, как известно, представляет собой амплитудно-модулированный звуковой поток. С точки зрения речеобразования речевой поток может быть представлен как чередование открытых и закрытых слогов, в центре которых стоят слогообразующие фонемы с предшествующими и последующими согласными [Зиндер, 1960; Чистович и др., 1965]. С физиологической точки зрения распадение речевого потока на слоги обусловлено работой артикуляционного аппарата, то есть усилением или ослаблением мускульного напряжения при произнесении звуков, динамическими модуляциями речеобразующих органов. Поскольку акустическая мощность гласных значительно больше мощности согласных, акустическим коррелятом артикуляции слогов и является амплитудная модуляция.

По осциллограммам огибающих уровня звукового давления, записанным на шлейфном осциллографе К-115 с выхода микрофонного усилителя через детектор и сглаживающий фильтр с полосой прозрачности 0–80 Гц, было видно, что, хотя АМ речи очень сложна, чередование максимумов и минимумов звукового давления имеет определенную периодичность, а именно — максимумы, как правило, приходятся на гласные, а минимумы — на согласные.

Наша задача состояла в измерении амплитудно-временных характеристик речи, полученных с помощью логарифмического самописца уровня электроакустических колебаний типа Н-110. С этой целью осциллограмма огибающей речевого потока разбивалась на участки, соответствующие максимумам (пикам) амплитудной модуляции. При этом максимумы, имеющие уровень менее чем 2 дБ, в расчет не принимались. Далее межпиковые интервалы АМ измерялись, и составлялись гистограммы распределения межпиковых интервалов на всем отрезке речи каждого диктора.

Всего было исследовано восемнадцать дикторов: восемь русских, десять иностранных (четыре немецких, два шведских, четыре английских). Длительность анализируемых отрезков речи составляла три минуты. В гистограммах временные характеристики максимумов АМ были преобразованы в частотные согласно выражению F = 1/T, где F — частота (Гц), Т — величины межпиковых интервалов (с).

Результаты измерений представлены семейством кривых для русских дикторов на рис. 3, для иностранных — на рис. 4.

Кривые являются вероятностными характеристиками речи, то есть отражают вероятность появления в потоке речи пиков АМ с определенной частотой повторения. Несмотря на индивидуальные различия, в речи (как русской, так и иностранной) преобладает АМ с частотой 4–5 Гц, соответствующая средним временным интервалам 250–200 мс. Это приблизительно совпадает с областью средних длительностей ударных русских гласных — 230 мс между двумя мягкими согласными, 150 мс между двумя твердыми согласными [Бондарко, 1964]. Длительность же согласных примерно на порядок меньше длительности гласных. Таким образом, исследования подтверждают предположение, что АМ речи в общем виде является отражением процесса слогообразования.