Ученые Томского государственного университета систем управления и радиоэлектроники исследуют малоизученную шепотную речь человека для создания алгоритмов по распознаванию речи человека с высокой точностью.  


На кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) с помощью созданного здесь уникального математического аппарата проводятся исследования по распознаванию речи человека на уровне параметров речевого сигнала. Их результатом может стать создание новых алгоритмов, принципиально отличающихся от существующих, для корректного и более точного распознавания речи человека.


Как пояснил доцент кафедры КИБЭВС Антон Конев, речевые технологии в ближайшем будущем будут активно развиваться - для создания голосовых ассистентов, а также других новых продуктов в сфере искусственного интеллекта. Одна из главных целей разработчиков во всем мире - добиться полностью автоматического перевода устного текста любого объема в письменный с высокой точностью, без искажений.


"Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум - это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений", - говорит Антон Конев.


Суть этого подхода, по словам доцента ТУСУРа, - что основой распространенных алгоритмов является обучение на большом количестве примеров произнесенных звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесенное. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.


"Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается, и существующие системы ошибаются очень часто, - подчеркивает исследователь. - Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний - особенна высока вариативность в русском языке, где "съедается" большой процент звуков, если мы говорим в привычном быстром темпе".


Поэтому своей задачей ученые кафедры КИБЭВС ТУСУРа называют определение более точных параметров звуков, в том числе с помощью изучения шепотной речи. 


Есть классический термин - форманта, максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шепотную речь, которая отделена от голосового источника и лишена этих искажений.


Исследования, проводимые с использованием уникальной разработки ученых кафедры КИБЭВС ТУСУРа - математического аппарата, учитывающего строение слуховой системы человека, показали, что распознавание ударных звуков шепотной речи на основе общепринятых параметров возможно с надежностью не менее 70 %.


Такой результат позволяет говорить о перспективности исследований для выявления точных параметров звуков, которыми мало занимаются в России и за рубежом, но которые могут послужить основой для принципиально нового подхода в точном распознавании речи - для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов, развитие которых становится все более актуальным. ​​​​

Похожие новости

  • 09/06/2016

    ТУСУР поможет создать систему для подписи документов со смартфона

     Ученые Томского госуниверситета систем управления и радиоэлектроники (ТУСУР) примут участие в разработке программного обеспечения, которое позволит безопасно использовать через смартфоны и планшеты электронную подпись для счетов, оформления госуслуг и официальных документов, сообщила пресс-служба вуза.
    953
  • 06/04/2018

    Томские ученые создают приложение для «чтения» медицинских анализов

    ​"Прочитать" и интерпретировать результаты медицинских анализов скоро будет по силам смартфонам. Как сообщили в пресс-службе Томского госуниверситета систем управления и радиоэлектроники (ТУСУР), специалисты работают над созданием специального мобильного приложения.
    413
  • 21/11/2016

    100 экспортирующих IT-компаний работают в Томской области

    ​В Томске, по оценкам экспертов, работает не менее 100 экспортирующих IT-компаний. Климат и барьеры в сфере информационных технологий обсудили специалисты на панельной дискуссии, открывшей 7-ю конференцию «Город IT».
    1385
  • 06/04/2017

    ТУСУР создаёт ситуационный центр на основе собственных ГИС-технологий

    В ТУСУРе разрабатывается идеология и программные компоненты интеллектуального ситуационного центра для прогнозирования естественных событий природного характера на территории Томской области с применением ГИС-технологий.
    768
  • 18/01/2018

    Робототехнику в российских школах будут изучать по разработанным в ТУСУРе материалам

    Преподаватели Томского государственного университета систем управления и радиоэлектроники выступили авторами эксклюзивных интерактивных рабочих тетрадей по робототехнике для школьников, выпущенных известной российской компанией.
    517
  • 29/02/2016

    Томские ученые заочно определят депрессию и уровень интеллекта

    ​Ученые Томского государственного университета систем управления и радиоэлектроники (ТУСУР) и Томского госуниверситета (ТГУ) разработали аппаратно-программный комплекс, способный дистанционно провести психодиагностику.
    1051
  • 27/10/2017

    Ректор ТУСУРа принимает участие в форуме Russian Blockchain Week – 2017

    Ректор ТУСУРа Александр Шелупанов принимает участие в форуме Russian Blockchain Week – 2017, который проходит 26 – 28 октября в Российском экономическом университете им. Г. В. Плеханова (РЭУ).
    843
  • 10/10/2018

    Форум U-NOVUS проходит в Томске

    ​Пятый форум U-NOVUS официально открылся в Томске. В этом году он проходит в новом формате: сделан упор на воркшопы, в ходе которых представители крупных технологических компаний поделятся своими практическими навыками.
    637
  • 25/09/2018

    Куда можно сходить в Томске во время форума U-NOVUS

    ​«Форум новых решений» U-NOVUS – 2018 пройдет 10-13 октября на площадках томских университетов, компаний, в пространстве «Точка кипения – Томск», технопарке «Кванториум» и СК «Гармония». В программ форума U-NOVUS — серия воркшопов, на которых малые технологические компании, научные команды из университетов и научных организаций, крупные компании будут совместно работать над вызовами индустрий.
    126
  • 18/05/2018

    В ТУСУРе разработали электронный курс по теории игр

    ​На факультете безопасности ТУСУРа разработан электронный курс по дисциплине "Теория игр и исследование операций" с индивидуализацией обучения, с помощью которого студенты осваивают материал, анализируют ошибки и выполняют контрольные работы.
    320