на 20 дБ. Для достижения более низкого класса разборчивости речи требуется, естественно, меньшее превышение уровня речевого сигнала над шумом, что определяется расчетным путем (Покровский, 1962), Среднестатистическая частота амплитудной модуляции (AM) речи и ее связь с характеристиками слуха была предметом специального исследования (Морозов, Черниговская, 1975). Полученные гистограммы статистического распределения AM речи русских дикторов (из числа известных чтецов) показали, что наиболее часто встречающаяся AM речи сосредоточена в области 4–6 Гц (хотя в целом захватывает и более широкий диапазон). Параллельное исследование чувствительности слуха человека к AM звука показало, что ее максимальная величина наблюдается как раз в том диапазоне AM, в котором имеется максимум AM речевых звуков, т. е. в области 3–8 Гц. Это как раз укладывается в диапазон длительности речевых слогов, т. е. 330–120 мс. Высказывается гипотеза, что данное соответствие AM характеристик слуха и речи является не случайным, а возникло в процессе эволюции в результате взаимного согласования характеристик речи и слуха. Такая повышенная избирательность слуха к AM речи обусловливает высокую помехоустойчивость слухового восприятия человеком речевого сигнала на фоне различного рода шумов (Морозов, 1977).
Амплитудно-временные характеристики речи являются весьма важными в передаче слушателю главным образом ее экстралингвистической информации. Так, показано, что одна и та же фраза в зависимости от ее эмоциональной окраски характеризуется специфическим узором амплитудно-временных или, как их еще называют, динамических характеристик сигнала (Котляр, Морозов, 1976). Например, время нарастания и спада амплитуды звуков при выражении эмоции горя максимально велико, а при гневе максимально коротко (см. рисунок 7). Для выражения разных эмоций человек характерным образом видоизменяет амплитудно-временную организацию фразы[10], причем каждая из эмоций характеризуется своим специфическим набором указанных признаков.
Рис. 7. Осциллограммы огибающей звукового давления фразы «Спи, дитя мое» исполненной вокалистом с разными эмоциональными оттенками (Морозов, 1977).
1 – радость; 2 – горе; 3 – нейтрально; 4 – гнев; 5 – страх.
Наконец, амплитудно-временные характеристики речи вносят определенный вклад в восприятие ее семантического содержания. Речь идет не только о лингвистическом ударении и интонации, где роль амплитудно-временных характеристик речи очевидна (Арутюнян, 1966; Бондарко, 1977), но и о восприятии человеком слов и фраз связной речи. Несомненная значимость амплитудно-временных и других просодических характеристик речевого сигнала для его восприятия в последнее время приводит к их более активному использованию в системах автоматического распознавания речи (Ли, 1983).
1.2. Экстралингвистическая информация и восприятие вокальной речи
Речевой сигнал несет слушателю информацию двух родов. Вопервых, это собственно речевая или лингвистическая