Идентификация и верификация
VoiceKey – технология разграничения доступа по парольной фразе
VoiceNet – технология идентификации на основе сравнения биометрических признаков речи
Voice Key Service - Система разграничения доступа к информационным ресурсам на основе биометрической речевой верификации пользователей
Голос - универсальный ключ
Одна из задач речевых технологий заключается в том, чтобы определить, какому человеку соответствует тот или иной речевой сигнал. Системы, решающие эту задачу, делятся на два больших класса – системы верификации и идентификации. Верификация – это процедура подтверждения личности говорящего, а идентификация – определение личности из заданного, ограниченного списка людей. В настоящее время системы идентификации и верификации голоса пользуются все большей популярностью во всем мире. Это объясняется в первую очередь естественностью и привычностью речевого взаимодействия между человеком и компьютерной системой.
Голос человека несет индивидуальную информацию в силу акустических особенностей речи, которые различны и уникальны по своей природе. Они отражают как особенности физиологического строения артикуляторного аппарата, так и приобретенные привычки. Именно поэтому в последнее время компании-разработчики биометрических систем используют голос для определения личности говорящего.
Все чаще и чаще встречаются системы, где голос выполняет функцию защиты. Через голос проверяются права доступа к компьютерным сетям, помещениям, банковским системам, камерам хранения и многому другому. Практика показала, что парольная защита является недостаточно надежной. Текстовые пароли и ключи уступают свое место верификации личности по голосу. Именно голос является тем универсальным ключом, который нельзя подделать, сломать или украсть.
Верификация личности по голосу предполагает соответствие заранее установленного речевого образца вновь предъявляемому. Пользователь предварительно устанавливает какую-нибудь фразу в качестве пароля. Затем, каждый раз обращаясь к данной системе, пользователь произносит свой пароль. Система же, в свою очередь, проверяет, соответствует ли произнесенный голос заранее установленному эталону. Если соответствие подтверждается, то доступ к системе открывается. Таким образом, верификация по голосу обеспечивает большую степень надежности по сравнению с верификацией по паролю, вводимому с клавиатуры. Чужой голос подделать невозможно, в то время как подделка чужого пароля вполне доступна.
Идентификация личности по голосу представляет собой процесс установления, кому из ограниченного списка людей принадлежит голос. «Изучив» фонотеку, система укажет голос, наиболее близкий к исследуемому образцу.
Построение классической системы распознавания дикторов происходит в три этапа: этап выделения первичных признаков, этап моделирования дикторов и этап принятия решений. Блок принятия решений используется непосредственно в ходе работы системы идентификации или верификации диктора для получения результатов на основании данных, полученных из первых двух блоков.
Существует множество способов моделирования дикторов (построения моделей голоса диктора) для решения задач идентификации. Выбор модели зависит от типа используемой речи, требуемой эффективности системы, простоты обучения и распознавания, объемов памяти для хранения моделей и скорости вычислений. Среди распространенных моделей голоса можно выделить следующие: модели на основании спектральных характеристик, статистик основного тона и смесей гауссовых распределений.
Область применения систем, определяющих личность говорящегo по голосу, можно разделить на два обширных блока:
Первый блок составляют задачи контроля прав доступа к различным системам.
Примером может служить «голосовой ключ» на входе в помещения с ограниченным доступом. В данном случае система «впускает» тех, чей голос содержится в базе данных. Еще один пример – обеспечение максимально быстрого доступа к личной банковской информации по телефону. Различные банковские операции (также, как и доступ к каналам связи, базам данных, вычислительным системам и т.д.) возможны по телефону только при условии, если банковский компьютер узнает голос клиента.
Второй блок связан с использованием систем анализа голоса говорящего при проведении криминалистических экспертиз и оперативно-розыскной деятельности.
При различных чрезвычайных происшествиях, например, авиационных катастрофах, на основе записей переговоров можно восстановить обстановку и картину происшествия, определить кто произносит ту или иную фразу. Более того, по голосу возможно составить приблизительный внешний (обликовый) портрет телефонных шантажистов, террористов и других преступников. В современной юриспруденции голос может служить явной уликой в суде.





Нестор
Гном 2М
Незабудка
VoiceCom
Оратор
VoiceKey