Команды гуманитариев и программистов создали IT-проекты на единственном в России лингвистическом хакатоне LinguaHack. Победители разработали алгоритм для выявления в текстах новостей названий городов России, имен президентов и руководителей администраций областей, округов и других субъектов страны. 

В LinguaHack приняли участие пять команд студентов ТГУ и ТУСУРа. В течение трех дней они решали кейсы по извлечению заданной информации из новостей, автоматической классификации текстов на положительные и отрицательные, созданию чат-бота для оптимизации колл-центров. Задания предоставили партнеры хакатона – информационное агентство ТАСС, МТС, консалтинговая компания Perfect Art.

Команда победителей NoName решала проблему выявления в текстах названий российских городов, имен президентов и руководителей администраций субъектов страны. Студенты Анфиса Сборщикова и Виктория Шилова (ФИЯ), Екатерина Атамасова (ММФ), Александр Раушкин (ТУСУР) создали библиотеки со списками всех требуемых субъектов и алгоритм, анализирующий, встречаются ли они в тексте новости или нет. Они также предложили правила для различения названий городов и имен или фамилий, например, Владимир-Владимир. Программа будет полезна новостным агрегаторам и СМИ для анализа актуальной политической повестки в регионах.

– В хакатоне предложил поучаствовать наш преподаватель. Темы кейсов были известны заранее, и мы решили, что хотим работать с извлечением сущностей из текста, – рассказала студентка факультета иностранных языков Анфиса Сборщикова. – Когда нам дали сам кейс, мы подумали, что это легко сделать. Но когда начинаешь копать глубже, то понимаешь, что все не так просто, в каждой категории есть масса исключений и особенностей, все-таки русский язык очень богатый. Решать это всё было очень интересно.

Экспертами на хакатоне выступили начальник управления инновациями в сфере науки, техники и технологий ТГУ Михаил Головатов, программист Elecard-Med Company Валерий Дацюк, руководитель отдела исследований и разработок компании Perfect Art Андрей Орлов и старший инженер этой же компании Михаил Ожгибесов.

– Мы смотрели на понимание задачи, на проработку, то есть на ход мысли, провели ли обзор способов решения задачи. Когда начали реализовывать какой-то способ решения задачи, то какой был подход, как проверяли, работает или нет, что делали, чтобы исправить неработающее. Мы смотрели на то, как это решение было автоматизировано, – рассказал Андрей Орлов, руководитель отдела исследований и разработок компании Perfect Art. – И еще оценивали фишечки, которые ребята смогли скреативить за эти 2 дня, – искрометность презентации, какие интересные методологические решения применяли, например, проверка текстов из Википедии и другие.

Компания Perfect Art предложила команде Pocket Coders, занявшей второе место, вместе продолжить работу над проектом по классификации текстов и наградила их специальными дипломами.

– Лингвахакатон задумывался для пропаганды новой магистерской программы «Компьютерная и когнитивная лингвистика». Однако наиболее значимым его результатом стало выявление творческих талантливых студентов, способных работать в командах. Победители LinguaHack-2018 уже сейчас работают над проектом в составе лаборатории когнитивных исследований языка ТГУ. Победителей LinguaHack-2019 также ждут новые проекты лаборатории. Надеемся увидеть их и в числе абитуриентов магистерской программы, познакомиться с которой можно на занятиях «Школы компьютерной и когнитивной лингвистики», которую мы проводим по субботам, – отметила профессор ТГУ Зоя Резанова.

Лингвистический хакатон прошел при поддержке Бизнес-инкубатора ТГУ.

Магистерская программа «Компьютерная и когнитивная лингвистика» открыта на базе САЕ «Институт человека цифровой эпохи» ТГУ. Студенты изучают формальные модели языка, языки программирования, математическую статистику, дисциплины, синтезирующие лингвистические и математические подходы (Text Mining), анализ естественного языка (NLP), основы психолингвистики, методы окулографии в лингвистических исследованиях и другие дисциплины. Обучение предусматривает много практики.


Похожие новости

  • 12/02/2018

    Ученые ТУСУРа научат компьютер более точно распознавать человеческую речь

    Ученые Томского государственного университета систем управления и радиоэлектроники исследуют малоизученную шепотную речь человека для создания алгоритмов по распознаванию речи человека с высокой точностью.
    593
  • 18/01/2018

    Робототехнику в российских школах будут изучать по разработанным в ТУСУРе материалам

    Преподаватели Томского государственного университета систем управления и радиоэлектроники выступили авторами эксклюзивных интерактивных рабочих тетрадей по робототехнике для школьников, выпущенных известной российской компанией.
    777
  • 29/02/2016

    Томские ученые заочно определят депрессию и уровень интеллекта

    ​Ученые Томского государственного университета систем управления и радиоэлектроники (ТУСУР) и Томского госуниверситета (ТГУ) разработали аппаратно-программный комплекс, способный дистанционно провести психодиагностику.
    1243
  • 22/03/2019

    В Томске разрабатывают ТВ-приставку с распознаванием лиц и персональными рекомендациями

    ​Резиденты томского студенческого бизнес-инкубатора «Дружба» намерены вывести свои продукты на западные рынки. Компания Zoom TV разрабатывает ТВ-приставку с распознованием лиц и составлением персональных рекомендаций.
    168
  • 27/10/2017

    Ректор ТУСУРа принимает участие в форуме Russian Blockchain Week – 2017

    Ректор ТУСУРа Александр Шелупанов принимает участие в форуме Russian Blockchain Week – 2017, который проходит 26 – 28 октября в Российском экономическом университете им. Г. В. Плеханова (РЭУ).
    1201
  • 25/01/2019

    ТУСУР - Samsung: в приоритете - безопасность Интернета вещей

    ​25 января в Томском государственном университете систем управления и радиоэлектроники открывается первый созданный в Томске Центр по безопасности Интернета вещей совместно с «IoT Академией Samsung».
    302
  • 03/12/2018

    ТУСУР и Cognitive Technologies открыли совместную лабораторию когнитивных технологий

    ​30 ноября в ТУСУРе состоялось открытие совместной лаборатории университета и ведущего мирового разработчика систем искусственного интеллекта для беспилотных транспортных средств компании Cognitive Technologies.
    1038
  • 06/04/2018

    Томские ученые создают приложение для «чтения» медицинских анализов

    ​"Прочитать" и интерпретировать результаты медицинских анализов скоро будет по силам смартфонам. Как сообщили в пресс-службе Томского госуниверситета систем управления и радиоэлектроники (ТУСУР), специалисты работают над созданием специального мобильного приложения.
    676
  • 19/04/2019

    Разработка резидентов бизнес-инкубатора ТУСУРа заменит ключи от домофона смартфоном

    ​Резиденты студенческого бизнес-инкубатора (СБИ) Томского государственного университета систем управления и радиоэлектроники совместно с компанией KODE разработали систему, которая позволяет открывать дверь в подъезд с помощью смартфона.
    147
  • 26/02/2019

    К рынку IoT готовы

    ​Смелых инициатив и собственных разработок в сфере высоких технологий у России уже немало, зарождающемуся рынку требуются правила игры и инфраструктура. 20 февраля 2019 года в ежегодном послании Федеральному собранию президент Владимир Путин поручил Правительству РФ разработать программу развития инфраструктуры цифровой экономики.
    206