Коллектив ученых Национального исследовательского ядерного университета "МИФИ", Национального исследовательского центра "Курчатовский Институт" и Воронежского государственного университета разработали метод, обучающий компьютер распознавать пол человека по написанному им тексту с точностью до 80 процентов.

Научная разработка относится к области компьютерной лингвистики. Исследование проводилось по гранту Российского Научного Фонда. Результаты опубликованы в журнале Procedia Computer Science.

Многочисленные научные исследования показывают, что в письменном тексте неизбежно отражаются характеристики его автора – пол, психологические особенности, уровень образования. Речь является ценным психодиагностическим инструментом, который используют специалисты кадровых служб крупных компаний, а также служб безопасности.

На основе анализа речи можно диагностировать наличие у человека некоторых заболеваний (деменции, депрессии) и склонность к суицидальному поведению. Потребность в установлении характеристик автора текста также растет с развитием интернет-коммуникаций: компаниям важно знать, каким группам лиц нравятся их товары и услуги.

Ученые, работающие в данном направлении (лингвисты, психологи, специалисты по информационным технологиям), на основе численных значений различных параметров текста строят математические модели для диагностирования тех или иных параметров личности.

Коллектив специалистов проанализировал эффективность различных технологий машинного обучения с использованием нейронных сетей для анализа текстов.

В ходе исследования они сравнили точность решения задачи гендерной идентификации текстов на основе двух подходов к моделированию на основе данных: с одной стороны, алгоритмы машинного обучения (метод опорных векторов и градиентный бустинг), с другой стороны – нейронные сети глубокого обучения (сверточные нейронные сети и рекуррентные нейронные сети с долгой краткосрочной памятью).

«Мы достигли высоких результатов в определении пола автора текста благодаря продвинутым нейросетевым моделям, в условиях, когда автор не скрывает свой пол. На очереди задача определения пола в условиях его намеренного сокрытия», – говорит доцент НИЯУ МИФИ Александр Сбоев.

Так, в следующих текстах, размещенных изначально на сайте знакомств, нейросеть без труда находит подвох в десяти случаях из десяти, притом, что автор намеренно ставит в подписи имя противоположного пола.

Текст написан девушкой: «Я красивый, накачанный мужчина 30 лет. Работаю в крупной нефтегазовой компании на хорошей должности с приличной зарплатой. Живу в собственной квартире в Москве. В собственности также находится небольшой, но симпатичный домик в одной из деревушек Италии. Увлекаюсь спортом, в частности, футболом. Люблю выбираться куда-нибудь на выходные, не терплю домоседок. Девушка, которая мне бы подошла, должна обладать скромным нравом, красивой внешностью и привлекательной фигурой по современным стандартам. Она должна разделять мои интересы, не должна быть ревнивой и не должна пытаться вызвать чувство ревности у меня. Содержать девушку я не собираюсь, так как считаю, что в семье должны работать оба. Бюджет также предпочитаю вести раздельно. Не потерплю измены».

Текст написан мужчиной: «Здравствуйте! Я крайне недовольна, крайне! Почему вы так себя с нами ведете?! Мы же тоже люди, мы все равны! Вы сексист? Я больше не буду это терпеть! Я твою машину вообще всю разобью, разрисую. Жди. Финишу таким быть».

Результаты этого исследования показали, что подход, основанный на использовании сверточной нейронной сети и методов глубокого обучения для распознавания пола человека, написавшего текст, является наиболее оптимальным.

Сейчас группа исследователей работает над задачей распознавания возраста.

Похожие новости

  • 26/11/2018

    Зачем в России создали центр квантовых технологий?

    ​Первые квантовые компьютеры могут появиться на Земле в ближайшие годы, но какую роль в их "рождении" сыграет Россия? Сергей Кулик, научный руководитель Центра квантовых технологий МГУ, рассказал, как российские физики будут развивать подобные технологии, и создавать квантовые вычислители в ближайшие годы.
    925
  • 19/11/2018

    Российские ученые работают над интерфейсом «глаз – мозг — компьютер»

    Состоялось Общее собрание членов Российской академии наук — сессия по выбору научно-технических приоритетов. Важное событие. Это первый большой сбор академиков после вступления в силу в июле 2018 года нового закона о РАН, где ей отводится значимая роль в будущем развитии страны.
    157
  • 13/09/2018

    Нейронную сеть научили распознавать жалобы на лекарства

    ​Российские программисты обучили нейронную сеть анализировать мнения пользователей соцсетей о действии лекарств. Искусственный интеллект теперь может излагать пользовательский текст в медицинских терминах.
    320
  • 14/12/2016

    Сверхпрочные ноутбуки создадут для Сибири московские разработчики

    ​Ударопрочные, водостойкие ноутбуки для работы в ±50 °С разрабатывают в "Т-Платформе" для геологов и нефтяников - компания получила субсидию Минпромторга в 150 млн рублей. Российская компания "Т-Платформа" получила 150 млн рублей субсидии Министерства промышленности и торговли РФ на создание отечественного ноутбука для работы в экстремальных условиях.
    960
  • 18/12/2018

    Сибирские биохимики нашли связь дефектов стволовых клеток с аутоиммунными заболеваниями

    ​Рассеянный склероз, волчанка и другие аутоиммунные болезни могут возникать из-за серьезных нарушений в работе стволовых клеток костного мозга, заставляющих их собирать особые агрессивные антитела. Об этом рассказали биохимики, выступавшие на конгрессе "Аутоиммунные и иммунодефицитные заболевания" в Москве.
    604
  • 21/08/2018

    Ученые выяснили, что происходит с микрофлорой кишечника при изменении диеты

    Ученые Балтийского федерального университета имени И. Канта приняли участие в масштабном исследовании, установившем, как меняется микрофлора кишечника при краткосрочном изменении диеты. Оказалось, что всего двух недель сбалансированного питания достаточно, чтобы состав микроорганизмов в кишечнике ощутимо изменился.
    422
  • 04/10/2017

    Степан Данилов: «Сколково» – это дауншифтинг для хорошего стартапа

    Развитие инновационного бизнеса – самая животрепещущая тема в последнее время, если судить по инфоповодам. «Точка кипения» от Агентства стратегических инициатив, новосибирский консорциум, в который вошли технопарк, СО РАН и НГУ, Национальная технологическая инициатива, функционирование ФРИИ и РВК – повестка дня достаточно обширная.
    719
  • 19/11/2018

    Биолог из Новосибирска разработал мобильное приложение для сельского хозяйства

    Труд агрономов и селекционеров иногда содержит очень утомительные операции. Например, периодически им требуется подсчитывать количество зерен в колосьях пшеницы. Не делать этого вручную позволяет мобильное приложение SeedCounter, которое вместе с коллегами создал биолог Михаил Генаев из Новосибирска.
    155
  • 13/03/2018

    Российские ученые нашли способ ранней диагностики ишемии мозга при травмах

    ​Российские нейрофизиологи нашли способ ранней диагностики ишемии мозга при травмах. Выяснилось, что начальные этапы повреждения клеток этого органа от кислородного голодания можно выявить по энцефалограмме.
    534
  • 26/03/2018

    Как объединить блокчейны

    На сегодняшний момент набралась критическая масса знаний и информации, придуманных решений, которые могут быть как-то использованы в экономике. Единственное, что стоит сделать в первую очередь, это все-таки поменять подход.
    532