Синтез речи
Оратор – синтезатор русской речи по тексту TTS
Автоматический синтез речи - это технология, позволяющая преобразовать входную текстовую информацию в звучащую речь. При этом одним из важнейших аспектов является качество синтезируемой речи. Именно оно определяет пригодность использования технологии синтеза речи на современном коммерческом уровне.
Для узкого приеменения качество звучания может быть сведено к максимально естественной, за счёт компиляции заранее записанных длительных речевых фрагментов, относящихся к данной области. Примером такого синтеза (называемого макросинтезом) могут служить системы оповещения о движении поездов, применяющиеся на вокзалах. Гораздо сложнее разработать синтезатор речи для неограниченного текста любой предметной области. В таком случае пользователь может задать системе синтеза на произношение любую фразу или предложение.
Текстонезависмость синтеза достигается, как правило, компиляцией сигнала из минимальных звуков – аллофонов, которые составляют звуковую базу данных. Такая небольшая база данных (от 1 до нескольких десятков мегабайт памяти) представляет собой нарезку всех возможных аллофонов в произнесении одного диктора, который и является прообразом «синтезированного голоса». В дальнейшем, текст, который подлежит синтезированию, подвергается автоматическому лингвистическому и фонетическому анализу: в каждом предложении определяются места пауз, подбирается правильное интонационное оформление, для всех слов определяются места ударения и, наконец, осуществляется автоматическое транскрибирование слов. На основании этой информации из базы аллофонов выбираются нужные, которые и произносятся последовательно.
Еще одной активно развивающейся в последнее время технологией является технология Unitselection. В рамках данной технологии записывается речевая база данных очень большого размера, из которой в процессе синтеза выбираются подходящие фрагменты максимальной длины. Подобный подход обеспечивает очень высокое качество звучания. Тем не менее, он имеет ряд существенных ограничений, главным из которых является необходимость хранить огромную базу данных (гигабайты памяти), что делает возможным применение этой технологии в основном для интернет-сервисов.
Технология автоматического синтеза речи может быть полезна в таких отраслях и направлениях как:
- Телекоммуникации
- Мобильные устройства
- Промышленные и бытовые электронные устройства
- Автомобильная индустрия
- Образовательные системы
- Компьютеризированные системы
- Internet-сервисы
- Системы ограничения доступа
- Аэрокосмическая промышленность
- Военно-промышленный комплекс
Синтезаторы речи, как совместно с технологией распознавания речи, так и отдельно, обладают широкими возможностями применения. Например, в call-центрах и автоинформационных системах. Технология синтеза речи многого достигла в своем развитии. Синтезированную речь сегодня часто сложно отличить от естественной. Позвонив в информационную службу, мы уже слышим не роботизированную речь, а приятный естественный голос. Технология синтеза речи, интегрированная в автоинформационную систему, «охотно» вступит в беседу с каждым дозвонившимся и поможет в получении информации. На 90% запросов к любым информационно-справочным системам способен отвечать компьютер. Автоинформационная система с синтезом речи освобождает операторов от ответов на часто повторяющиеся вопросы такого плана как курс доллара, точное время, прогноз погоды и многое другое.
Технология синтеза речи открывает широкие возможности для людей с физическими недостатками. Разработаны говорящие машины для слепых и слабовидящих. Для немых предусмотрены портативные устройства синтеза речи, в которых сообщение набирается на клавиатуре, что позволяет общаться с другими людьми.
На сегодняшний день благодаря электронным словарям и переводчикам на основе технологии синтеза речи возможно изучение иностранных языков с постановкой правильного произношения. Электронный словарь помещается в кармане и может быть использован в любом месте, а не только за рабочим столом, как это обычно бывает с традиционным книжным словарем.
Еще одним примером синтеза речи могут служить различные системы звукового оповещения: телефонная справочная информация, объявление станций в метро, информация об отправлении автобуса или поезда, реклама в универмаге.
На основе технологии синтеза речи созданы «говорящие» книги (аудиокниги). Такие книги позволяют по-новому воспринять литературное произведение – в его звуковом оформлении. Многие люди полагают, что напечатанный текст не передает всей полноты ощущений. В то время как элементарная разница в произношении или, например, интонации героев делает произведение более живым.





Нестор
Гном 2М
Незабудка
VoiceCom
Оратор
VoiceKey