Поиск ключевых слов
VoiceDigger – nехнология автоматического поиска “ключевых” слов и словосочетаний
Системы выделения ключевых слов дают возможность анализировать диалоги людей с указанием места ключевых слов в потоке речи. Они позволяют извлекать нужную информацию из большого потока речи независимо от спонтанности организации диалога, лексикона, количества собеседников и шумовых помех.
Процесс поиска может быть организован либо в реальном времени, либо в сформированных звуковых файлах. Для достижения максимального эффекта и комфортности использования технологии, интересующее слово должно вводиться с клавиатуры. Все подготовительные и обучающие процессы должны быть скрыты от пользователей.
Технология поиска ключевых слов тесно связана с технологией распознавания речи, и до недавнего времени была её составляющей. Однако фактически грань между технологиями условна. При хорошем распознавании слитной речи и преобразовании её в печатный вид проблема поиска ключевых слов отпадает сама собой: поиск будет осуществляться в сформированном тексте. Тем не менее, в связи с недостаточным качеством работы современных систем распознавания слитной речи, подобный подход вовсе не является идеальным решением. Применяются другие подходы к выделению ключевых слов:
Поиск по шаблону. Для каждого ключевого слова записывается несколько вариантов его произнесения различными дикторами, на основе чего создается шаблон ключевого слова, который используется для организации поиска данного слова в речевом массиве при помощи алгоритмов динамического программирования. Главным недостатком такого подхода является то, что создание шаблона для каждого слова - достаточно затратный процесс (слово нельзя просто ввести с клавиатуры).
Поиск по фонемной решетке. При помощи системы распознавания фонем для речевого сигнала строится большая сеть возможных звуков в различные моменты времени, по которой осуществляется поиск возможных произношений слова или фразы. Данная технология схожа с поиском по тексту на выходе системы распознавания, но работает на уровне звуков, а не целых слов.
Организация поиска на основании Скрытых марковских моделей (СММ). Для каждого введенного с клавиатуры ключевого слова создается соответствующая его произнесению СММ, которая и используется при поиске в звуковом сигнале. Этот метод представляется одним из наиболее перспективных на данный момент и обеспечивает достаточно высокий процент количества правильно выделенных ключевых слов.
Задача нахождения ключевых слов в потоке речи может быть разделена на несколько направлений:
* Непосредственное выявление и определение места ключевого слова или словосочетания (поиск в фонограмме речи, речевых базах, поиск в реальном времени).
* Распознавание команд в слитном потоке речи, навигация по меню (menu-drive).
* Понимание смысла речи посредством поиска ключевых слов или фраз, для диалоговых систем.
Системы поиска ключевых слов востребованы в службах безопасности, телекоммуникационных компаниях, системах видеонаблюдений, или бродкастинговых комплексах (системы, осуществляющие широкоформатное вещание, например, радио, телевидение), а также для оперативного поиска информации в больших массивах данных.
Использование данных систем с целью государственной безопасности стало следствием возросшего в последнее время количества террористических актов. После событий 11 сентября вложения в данную область значительно возросли. Системы поиска ключевых слов можно использовать не только в телефонных разговорах, но и видео, аудио потоках, что значительно ускоряет процесс отслеживания информации.
В call-центрах данные системы используются для контроля за работой операторов. В спорных или конфликтных ситуациях супервайзер всегда может подключиться к разговору. Также данная технология очень эффективно может быть применена для анализа запросов клиентов, что позволяет проанализировать смещение спроса, интерес к новым продуктам и помогает делать выводы о перспективе развития отдельных направлений компании.





Нестор
Гном 2М
Незабудка
VoiceCom
Оратор
VoiceKey