Версия для печати

Аспирант политеха работает над распознаванием личности по голосу с помощью нейронной сети

25.02.2021
Аспирант политеха работает над распознаванием личности по голосу с помощью нейронной сети

Проблема аутентификации пользователей становится все более актуальной в силу увеличения кибератак и повышения уровня информационной безопасности. Наиболее подходящей и получившей широкое распространение в последние годы технологией защиты данных является аутентификация личности по его биометрическим данным – отпечатку пальца, голосу, изображению лица или радужной оболочки глаз. Именно данным направлением в научной деятельности и занимается аспирант первого года обучения ОмГТУ по направлению «Информатика и вычислительная техника» Даниил Иниватов.

Молодой исследователь работает над проектом под названием: «Обучение ансамблей искусственных нейронных сетей для идентификации диктора с учетом психоэмоционального состояния». Он предполагает усовершенствование методов распознавания личности путем обработки и анализа голосовых образов людей. В первую очередь, данной цели молодым ученым было решено добиваться при использовании метода ансамблирования нескольких нейронных сетей, обученных на различных типах голосовых образов и при использовании разнообразных архитектур.   

    Даниил Иниватов, аспирант ОмГТУ:

«Проблема аутентификации человека при помощи пароля непростая: люди могут забывать или терять пароли, их устройства могут легко взломать. Это довольно опасно с точки зрения возможности кражи конфиденциальных данных. Соответственно, специалисты придумывают разные способы, чтобы утечки информации не возникало. Эту проблему возможно решить при помощи биометрии. Я изучаю голос человека и стараюсь найти такие тонкости, благодаря которым можно отличить одного человека от другого. В этом исследовании мне помогает нейронная сеть.

Работу с голосовыми образами я начал еще в конце второго курса специалитета, обучаясь по специальности «Безопасность информационных технологий в правоохранительной сфере». Первоочередной задачей было создание программного комплекса, осуществляющего предобработку и формирование голосовых образов по определенным настраиваемым критериям. С успехом справившись с этим вопросом, решил продолжать свои научные исследования в этом направлении».

Исследование включает в себя несколько основных этапов, в которые включены формирование базы звуковых образов дикторов с различными ключевыми фразами, создание методики предобработки образов с целью их дальнейшего использования в обучении и тестировании комитетом нейронных сетей и, наконец, укомплектование комитета (ансамбля) искусственных нейронных сетей.

На данный момент у аспиранта уже есть собранная и обработанная база, на основе которой проводились исследования в рамках дипломного проекта. Однако данную базу было решено дополнить другими образами, в частности, воспользоваться открытыми датасетами, в которых помимо различных дикторов и кодовых фраз также присутствуют образы, нацеленные на спуфинг-атаки (образы, которые были сделаны искусственно при помощи средств обработки с целью обмана системы и выдачи синтезированного образа за образ объекта аутентификации). Текущей задачей, по словам исследователя, является формирование комитета, распознающего не только дикторов, но и синтезированные образы.

Возврат к списку