Анализ речевых сигналов

Sound Stretcher - Технология ускорения или замедления воспроизведения речи без искажения абсолютной высоты звука. Позволяет увеличить скорость прослушивания большого объема записанной информации, оптимизировать продолжительности радиорепортажа или звуковой рекламы

ReverbClipper - Новая технология компенсации реверберационных искажений. Позволяет повысить разборчивость речевых сигналов, записанных в помещениях с временем реверберации до 3с

Clear Voice - Набор программных модулей шумоочистки. Может использоваться для снижения уровня шумов, повышения разборчивости речи в каналах связи

Jingle Tracker - Специализированное ПО для поиска музыкальных композиций в эфире теле- радиостанций

Одной из важнейших составляющих речевых технологий являются методы обработки цифрового сигнала. Поэтому непосредственно сам анализ речевого сигнала можно выделить в отдельное направление. Например, анализ и параметризация сигнала речи является первым шагом в процессе распознавания речи или идентификации диктора. В технологии компиляционного синтеза речи также происходит обработка сигнала, но уже на самом последнем этапе – в акустическом модуле.

В отдельную область в анализе речевых сигналов, да и в речевых технологиях в целом, можно выделить технологию шумоочистки. Звуковой сигнал на фонограммах или в каналах передачи и записи звука отличается от исходного. Это объясняется, во-первых, тем, что в прослушиваемом сигнале в той или иной степени присутствуют шумы и искажения, оказывающие негативное влияние на качество и разборчивость речи, а во-вторых, особенностями слуха человека. В связи с этим достаточно часто возникает потребность в проведении специальной обработки или шумоочистки звукового сигнала.

Главной целью шумоочистки является доведение качества и разборчивости речевого сигнала до уровня, приемлемого для его комфортного прослушивания и понимания. Кроме этого очень важно сохранить значимые свойства и характеристики речи диктора, источник речевой информации, а также обстоятельства получения информации. На сегодняшний день разработаны и используются многофункциональные системы шумоочистки.

Кроме шумоочистки как самостоятельную задачу следует выделить получение текстов (текстовых расшифровок) звукозаписей речи (стенографирование), в том числе и низкого качества. Несмотря на применение всех возможных средств шумоочистки, речь на многих звукозаписях остается трудно воспринимаемой. Ее полноценный перевод в текст не осуществим без специальных вспомогательных средств и подготовки. Подобно тому, как для ремонта автомобиля необходима специальная оснастка, методика, навык и предварительное обучение, так и текстовая расшифровка требует своего профессионального подхода и оборудования. Процедура расшифровки не требует «высокого искусства», она в достаточной степени рутинна, формализована и доступна почти любому человеку с нормальным слухом. Тем не менее, при большом количестве звукового материала необходимо создание специализированных подразделений, оснащённых специальной технической базой для решения именно этой задачи .

Во многих задачах речевых технологий, в том числе и в задаче стенографирования, актуальным вопросом остаются методы замедления-ускорения речи. При этом в технологии замедления-ускорения речи очень важно сохранить качество звучащей речи и не испортить разборчивость. Другой пример - технология регулировки тембра, которая является обязательным элементом при интонационной модификации сигнала в синтезаторе речи.