устройство ввода какого типа позволяет идентифицировать пользователей по голосу

Как работает голосовая биометрия

Какая бывает биометрия, сколько это стоит и почему у этой технологии большое будущее.

устройство ввода какого типа позволяет идентифицировать пользователей по голосу. 61b93ab4d2ea072e1942a4e8538310cd. устройство ввода какого типа позволяет идентифицировать пользователей по голосу фото. устройство ввода какого типа позволяет идентифицировать пользователей по голосу-61b93ab4d2ea072e1942a4e8538310cd. картинка устройство ввода какого типа позволяет идентифицировать пользователей по голосу. картинка 61b93ab4d2ea072e1942a4e8538310cd

устройство ввода какого типа позволяет идентифицировать пользователей по голосу. cd4c97843d2b0ba3e85261735776bf8f. устройство ввода какого типа позволяет идентифицировать пользователей по голосу фото. устройство ввода какого типа позволяет идентифицировать пользователей по голосу-cd4c97843d2b0ba3e85261735776bf8f. картинка устройство ввода какого типа позволяет идентифицировать пользователей по голосу. картинка cd4c97843d2b0ba3e85261735776bf8f

устройство ввода какого типа позволяет идентифицировать пользователей по голосу. 23002019042020 b043bc2c9a61109a9e0625c34034f299f06d5ae7. устройство ввода какого типа позволяет идентифицировать пользователей по голосу фото. устройство ввода какого типа позволяет идентифицировать пользователей по голосу-23002019042020 b043bc2c9a61109a9e0625c34034f299f06d5ae7. картинка устройство ввода какого типа позволяет идентифицировать пользователей по голосу. картинка 23002019042020 b043bc2c9a61109a9e0625c34034f299f06d5ae7

Технический директор системного интегратора «Мерион Нетворкс»

«Ты у меня не такой как все» — не просто приятные слова, которые говорят нам родители и любимые. Это абсолютная правда!

На этой правде основана технология, которая помогает предотвращать финансовые преступления и упрощает нам жизнь при общении с крупными компаниями. Давайте поговорим про голосовую биометрию.

Что это такое

Отпечатки пальцев, рисунок вен на руках, сетчатка или радужная оболочка глаза и голос — всё это у нас уникально. Даже походка уникальна. Ни у кого нет точно такой же.

Именно эти параметры используются в биометрии.

Биометрию делят на физиологическую и поведенческую. Вопрос: к какому типу отнести вены на руках? Правильно, к физиологической. А сетчатку? Тут тоже всё просто. А что вы скажете про голос? Тут я советую не торопиться с ответом про физиологический фактор и подумать вот о чём.

Знаете выражение «голос дрожит»? Бывало такое у вас? Первое публичное выступление, робкое свидание… Личный телефонный разговор в переполненном общественном транспорте… Думаю, да. Наш голос сильно зависит не только от физиологических особенностей, но и от эмоций.

Чтобы снизить зависимость оценки от эмоционального состояния, в алгоритмах голосовой биометрии анализируется около 80 разных параметров нашего голоса!

Как используется

У биометрии есть две базовых задачи: идентификация и аутентификация.

Идентификация отвечает на вопрос «Кто это?». Например, в контакт-центр поступает звонок от неизвестного абонента — и голосовая биометрия должна определить, кто звонит. Для этого голос звонящего сравнивается со всем массивом биометрических данных, который имеется в нашем распоряжении.

Вторая задача — аутентификация. Это немного иная ситуация, подтверждение личности. Мы предполагаем, кто звонит, но надо в этом убедиться. То есть в этом случае мы узнаём: «А точно ли нам звонит Петров Иван Геральдович с датой рождения 24 февраля 1963 года?»

Тут уже есть гипотеза о личности — следовательно, нам достаточно сравнить голос звонящего с образцом биометрии, которая хранится на нашей стороне.

Что это за образец? Это шаблон или, другими словами, слепок, который оставляет вам клиент (разумеется, вы должны получить на это согласие).

Слепки собирать сложно. Но сейчас государственные органы работают над созданием Единой биометрической системы (ЕБС). Биометрическим слепком, оставленным в одном банке, смогут пользоваться другие банки, таким образом защищая ваши деньги от мошенничества и скорее открывая вам доступ.

Сколько стоит внедрение биометрии

Рассчитать приблизительную окупаемость внедрения голосовой биометрической системы не так уж и сложно. Если для примера усреднить все требования заказчиков и пробежаться по решениям, предлагаемым вендорами, получим затраты на внедрение порядка 10 млн рублей. Разумеется, это некая «средняя по больнице», а конкретная сумма зависит от глубины интеграции в ИТ-систему покупателя.

Теперь представляем себе некий банк «РосЕвроБетонСвязьКапитал», в котором оператор в среднем за 1 минуту идентифицирует и аутентифицирует клиента, а затем примерно за 4 минуты разбирается с его вопросом.

Предположим, менеджмент «РосЕвроБетонСвязьКапитала» держит заработную плату агентов контакт-центра на рыночном уровне и платит 50 000 рублей в месяц за 160 трудочасов ( 9 600 минут) оператора.

Разделив 50 000 рублей на 9 600 минут, мы получим 5 (пять) — именно столько рублей стоит минута работы вашего оператора.

При внедрении в «РосЕвроБетонСвязьКапитал» голосовой биометрии мы можем смело вычеркнуть 1 минуту на идентификацию и аутентификацию. Тем самым, даже при небольшом количестве обращений в сутки (пусть это будет 5 000 обращений), будет сэкономлено 5 000 минут.

Итого: для типовой инсталляции, при затратах в 10 000 000 рублей на внедрение системы голосовой биометрии, мы имеем среднюю окупаемость через 13 месяцев. Неплохо, согласитесь?

Кто уже в биометрическом клубе?

Несложно догадаться, что технология интересна государству. Например, в Индии существует система UIDAI, используемая для идентификации граждан и резидентов. Представьте, в ней собрано примерно 1,15 млрд слепков. Это 85% населения!

В 2016 году в России активно заговорили о создании ФИСБУ (Федеральной информационной системы биометрических учётов), которая помогает искать преступников по биометрическим признакам: радужка, татуировки на теле и, возможно, в ближайшее время появится возможность искать по походке. Ориентировочно реализация этой фичи запланирована на 2021 год.

В бизнесе интерес не меньше. В 2017 году Сбербанк потратил 260 млн рублей на проект голосовой биометрии. По заверению руководства банка, проект имел плановую точку окупаемости через 2 года с момента внедрения.

«Почта-банку» голосовая биометрическая система помогла отбить мошеннические атаки примерно на 10 млн рублей.

Также в биометрическом клубе находятся Альфа-банк, «Хоум Кредит» и «Тинькофф» — все они уже внедрили технологию на участках обслуживания клиентов.

Итоги

Поскольку технология новая, запустить её на полную мощность пока не даёт имеющаяся законодательная база. Так, например, Правительство РФ пока не разрешает масштабировать биометрию на все типы банковских операций.

В то же время есть и другие проблемы. Это недоверие людей и отсутствие масштабной централизованной базы биометрических слепков.

Однако вектор развития технологии уже понятен — государство и бизнес будут стремиться автоматизировать авторизационные и идентификационные операции. Профиты от повышения их точности и скорости и одновременного уменьшения стоимости уже очевидны.

Источник

Аутентификация и идентификация по голосу с помощью когнитивных сервисов Microsoft

устройство ввода какого типа позволяет идентифицировать пользователей по голосу. f237efede29d4c2680353dbec2fcf3a9. устройство ввода какого типа позволяет идентифицировать пользователей по голосу фото. устройство ввода какого типа позволяет идентифицировать пользователей по голосу-f237efede29d4c2680353dbec2fcf3a9. картинка устройство ввода какого типа позволяет идентифицировать пользователей по голосу. картинка f237efede29d4c2680353dbec2fcf3a9

Когнитивные сервисы представляют доступ к различным облачным сервисам, которые позволяют работать с визуальной, голосовой и текстовой информацией. Кроме того, доступны различные поисковые функции Bing.

Для того, чтобы попробовать когнитивные сервисы в действии даже не обязательно иметь аккаунт Microsoft. Получить пробный ключ можно и с помощью аккаунта GitHub или LinkedIn. Пробная подписка не ограничена по времени, но ограничена по количеству используемых ресурсов за период. Ознакомиться с онлайн демонстрацией можно по адресу: Speaker Recognition API

Далее идет описание того как опробовать в действии аутентификацию пользователя с помощью голоса. Хоть сервис еще и в состоянии preview, но, несмотря на это, уже довольно интересен.
Сервис может быть использован из различных платформ, но я буду рассматривать создание C#/XAML приложения UWP.

Зайти и получить пробный ключ можно по ссылке: Microsoft Cognitive Services — Get started for free

устройство ввода какого типа позволяет идентифицировать пользователей по голосу. 702e7012a50b4fd192f872725e53b154. устройство ввода какого типа позволяет идентифицировать пользователей по голосу фото. устройство ввода какого типа позволяет идентифицировать пользователей по голосу-702e7012a50b4fd192f872725e53b154. картинка устройство ввода какого типа позволяет идентифицировать пользователей по голосу. картинка 702e7012a50b4fd192f872725e53b154

Нажимаем + и выбираем Speaker Recognition — Preview 10,000 transactions per month, 20 per minute.

Альтернативно можно получить ключ из аккаунта Azure (ну а как же без него). Найти Cognitive Services APIs и создать аккаунт с типом Speaker Recognition API.

устройство ввода какого типа позволяет идентифицировать пользователей по голосу. 8109b87199764644b075c17c3ee67d6e. устройство ввода какого типа позволяет идентифицировать пользователей по голосу фото. устройство ввода какого типа позволяет идентифицировать пользователей по голосу-8109b87199764644b075c17c3ee67d6e. картинка устройство ввода какого типа позволяет идентифицировать пользователей по голосу. картинка 8109b87199764644b075c17c3ee67d6e

Этот способ подходит тем, кто не планирует останавливаться только на пробных функциях.
Найти ключ можно здесь:

устройство ввода какого типа позволяет идентифицировать пользователей по голосу. image loader. устройство ввода какого типа позволяет идентифицировать пользователей по голосу фото. устройство ввода какого типа позволяет идентифицировать пользователей по голосу-image loader. картинка устройство ввода какого типа позволяет идентифицировать пользователей по голосу. картинка image loader

Прежде чем продолжить, давайте определимся с терминологией в рамках задачи:

Verification – подтверждение того, что речь произнесена определенной персоной. Подтверждение личности говорящего.
Identification — определение кто из множества известных нам пользователей произнес фразу.
Enrollment – процесс, в течение которого сервис тренируется распознавать голос пользователя. После получения сервисом определенного количества примеров фраз, профиль пользователя становится зарегистрированным и может использоваться для распознавания.

Описание конфигурирования и процесса распознавания голоса

Создается профиль пользователя
Производится Enrollment. Несколько раз на сервис отправляются повторы одной и той же фразы.
На данный момент поддерживаются только следующие языки: en-US (English US) и zh-CN (Chinese Mandarin).

Фразу для английского языка можно выбрать из следующего списка:
«i am going to make him an offer he cannot refuse»
«houston we have had a problem»
«my voice is my passport verify me»
«apple juice tastes funny after toothpaste»
«you can get in without your password»
«you can activate security system now»
«my voice is stronger than passwords»
«my password is not your business»
«my name is unknown to you»
«be yourself everyone else is already taken»

Первая произнесенная фраза привязывается к профилю. Сменить фразу можно только сбросив Enrollment с помощью ResetEnrollmentsAsync.

Давайте представим как мог бы выглядеть набор фраз на русском. Я начну, а вы предлагайте варианты в комментариях:
«Это квартира Антона Семеновича Шпака?»
«Спокойно, Маша, я — Дубровский!»
«Я — умный, красивый, в меру упитанный мужчина, ну в полном расцвете сил»

Создание приложения UWP

Создадим приложение UWP и добавим следующий NuGet пакет Microsoft.ProjectOxford.SpeakerRecognition
Добавляем в секцию Capabilities манифеста микрофон. Интернет (клиент) должен быть добавлен по умолчанию. Конфигурирование завершено и можно перейти к коду. Список необходимых пространств имен для работы с сервисом:

Необходимые пространства имен для работы с аудио:

Для работы с сервисом необходимо создать некоторые объекты. Строку с ключом подписки и клиента верификации. Клиент будет взаимодействовать с сервисом

После инициализации страницы необходимо инициализировать эти переменные:

Значением _subscriptionKey укажите ваш ключ подписки. Теперь по логике необходимо создать профиль пользователя:

Из ответа сервиса мы можем получить идентификатор профиля:

Следующим действием по порядку должна быть «тренировка» распознавания голоса. Разберем как создать поток аудио. Самый простой способ это прочитать файл с диска:

Фраза должна быть записана в режиме моно с частотой 16 КГц.

Второй вариант это записать голос с микрофона. Начало записи голоса:

Следующие параметры являются обязательными:

Остановка записи после какого-то промежутка времени:

и отправка потока сервису для enrollment-а:

Из response мы сможем получить следующие данные:
response.Phrase – произнесенная фраза
response.RemainingEnrollments– количество оставшихся повторов фразы

Распознавание отличается от enrollment-а только тем что используется метод VerifyAsync:

Исходный код получившегося приложения доступен на GitHub

Скриншот того что получилось ниже:

устройство ввода какого типа позволяет идентифицировать пользователей по голосу. 6d1ebd2325264d598842322b6a0fcb1e. устройство ввода какого типа позволяет идентифицировать пользователей по голосу фото. устройство ввода какого типа позволяет идентифицировать пользователей по голосу-6d1ebd2325264d598842322b6a0fcb1e. картинка устройство ввода какого типа позволяет идентифицировать пользователей по голосу. картинка 6d1ebd2325264d598842322b6a0fcb1e

Как единственный способ защиты, аутентификация по голосу, пожалуй, не самый надежный вариант. Но вот в качестве одного из элементов многофакторной аутентификации вполне может использоваться.

Опять же, интересна возможность идентификации, код которой аналогичен, но с некоторыми изменениями.

Так как промежуток времени, в течение которого производится запись может быть большим, то для того, чтобы дать сервису время завершить операцию, проверка запускается в цикле. Пример операции Enrollment-а:

Для идентификации используется все тот же пакет NuGet.
Исходный код приложения идентификации тоже выложен на GitHub.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *