Ученые Томского государственного университета систем управления и радиоэлектроники исследуют малоизученную шепотную речь человека для создания алгоритмов по распознаванию речи человека с высокой точностью.  


На кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) с помощью созданного здесь уникального математического аппарата проводятся исследования по распознаванию речи человека на уровне параметров речевого сигнала. Их результатом может стать создание новых алгоритмов, принципиально отличающихся от существующих, для корректного и более точного распознавания речи человека.


Как пояснил доцент кафедры КИБЭВС Антон Конев, речевые технологии в ближайшем будущем будут активно развиваться - для создания голосовых ассистентов, а также других новых продуктов в сфере искусственного интеллекта. Одна из главных целей разработчиков во всем мире - добиться полностью автоматического перевода устного текста любого объема в письменный с высокой точностью, без искажений.


"Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум - это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений", - говорит Антон Конев.


Суть этого подхода, по словам доцента ТУСУРа, - что основой распространенных алгоритмов является обучение на большом количестве примеров произнесенных звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесенное. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.


"Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается, и существующие системы ошибаются очень часто, - подчеркивает исследователь. - Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний - особенна высока вариативность в русском языке, где "съедается" большой процент звуков, если мы говорим в привычном быстром темпе".


Поэтому своей задачей ученые кафедры КИБЭВС ТУСУРа называют определение более точных параметров звуков, в том числе с помощью изучения шепотной речи. 


Есть классический термин - форманта, максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шепотную речь, которая отделена от голосового источника и лишена этих искажений.


Исследования, проводимые с использованием уникальной разработки ученых кафедры КИБЭВС ТУСУРа - математического аппарата, учитывающего строение слуховой системы человека, показали, что распознавание ударных звуков шепотной речи на основе общепринятых параметров возможно с надежностью не менее 70 %.


Такой результат позволяет говорить о перспективности исследований для выявления точных параметров звуков, которыми мало занимаются в России и за рубежом, но которые могут послужить основой для принципиально нового подхода в точном распознавании речи - для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов, развитие которых становится все более актуальным. ​​​​

Похожие новости

  • 18/01/2018

    Робототехнику в российских школах будут изучать по разработанным в ТУСУРе материалам

    Преподаватели Томского государственного университета систем управления и радиоэлектроники выступили авторами эксклюзивных интерактивных рабочих тетрадей по робототехнике для школьников, выпущенных известной российской компанией.
    787
  • 19/04/2019

    Разработка резидентов бизнес-инкубатора ТУСУРа заменит ключи от домофона смартфоном

    ​Резиденты студенческого бизнес-инкубатора (СБИ) Томского государственного университета систем управления и радиоэлектроники совместно с компанией KODE разработали систему, которая позволяет открывать дверь в подъезд с помощью смартфона.
    176
  • 05/03/2019

    Томские студенты создали алгоритм для поиска имен президентов в новостях

    Команды гуманитариев и программистов создали IT-проекты на единственном в России лингвистическом хакатоне LinguaHack. Победители разработали алгоритм для выявления в текстах новостей названий городов России, имен президентов и руководителей администраций областей, округов и других субъектов страны.
    375
  • 22/03/2019

    В Томске разрабатывают ТВ-приставку с распознаванием лиц и персональными рекомендациями

    ​Резиденты томского студенческого бизнес-инкубатора «Дружба» намерены вывести свои продукты на западные рынки. Компания Zoom TV разрабатывает ТВ-приставку с распознованием лиц и составлением персональных рекомендаций.
    181
  • 27/10/2017

    Ректор ТУСУРа принимает участие в форуме Russian Blockchain Week – 2017

    Ректор ТУСУРа Александр Шелупанов принимает участие в форуме Russian Blockchain Week – 2017, который проходит 26 – 28 октября в Российском экономическом университете им. Г. В. Плеханова (РЭУ).
    1248
  • 25/01/2019

    ТУСУР - Samsung: в приоритете - безопасность Интернета вещей

    ​25 января в Томском государственном университете систем управления и радиоэлектроники открывается первый созданный в Томске Центр по безопасности Интернета вещей совместно с «IoT Академией Samsung».
    329
  • 06/04/2018

    Томские ученые создают приложение для «чтения» медицинских анализов

    ​"Прочитать" и интерпретировать результаты медицинских анализов скоро будет по силам смартфонам. Как сообщили в пресс-службе Томского госуниверситета систем управления и радиоэлектроники (ТУСУР), специалисты работают над созданием специального мобильного приложения.
    711
  • 29/02/2016

    Томские ученые заочно определят депрессию и уровень интеллекта

    ​Ученые Томского государственного университета систем управления и радиоэлектроники (ТУСУР) и Томского госуниверситета (ТГУ) разработали аппаратно-программный комплекс, способный дистанционно провести психодиагностику.
    1257
  • 03/06/2019

    На хакатоне в ТГУ создали «серьезные игры» для Сбербанка и Газпрома

    В ТГУ в рамках конференции EdCrunch Томск, посвященной инновационных подходам в обучении, прошел трехдневный хакатон «Игровые технологии в образовании». Команды студентов ТГУ, ТУСУРа, ТПУ и IT-специалистов работали над созданием игровых компьютерных программ для решения задач, поставленных Сбербанком, Отраслевым научно-исследовательским учебно-тренажерным центром Газпрома (ОНУТЦ) и ТГУ.
    147
  • 26/02/2019

    К рынку IoT готовы

    ​Смелых инициатив и собственных разработок в сфере высоких технологий у России уже немало, зарождающемуся рынку требуются правила игры и инфраструктура. 20 февраля 2019 года в ежегодном послании Федеральному собранию президент Владимир Путин поручил Правительству РФ разработать программу развития инфраструктуры цифровой экономики.
    228