На площадке Новосибирского государственного университета состоялся ODS-митап по теме «NLU по-русски: ELMO vs. BERT». В роли докладчика выступил ассистент кафедры вычислительных систем Механико-математического факультета НГУ, преподаватель курса «Нейронные сети для обработки естественных языков» англоязычной магистерской программы Big Data Analytics and Artificial Intelligence Иван Бондаренко. Он поделился с аудиторией опытом применения последних разработок в области компьютерной лингвистики.

— Обработка естественных языков вышла на новый уровень: использование новых моделей позволяет учитывать значения слов, контекст и омонимы, значительно упрощает решение задачи составления словаря, что особенно актуально для языков с большим количеством словоформ (за счет падежей, уменьшительно-ласкательных форм и тому подобное), в том числе для флективных славянских языков. Использование подхода «переноса обучения» (transfer learning) можно считать своего рода революцией в компьютерной лингвистике, — отметил Иван Бондаренко во время своего выступления.

Одной из сфер применения машинного обучения для обработки естественных языков является проектирование чат-ботов, автоматизирующих процесс технической поддержки пользователей сложного технологического оборудования. Алгоритм должен правильно понять пользователя и выдать ответ, соответствующий запросу. Для этого нужно обучить модель на большом объеме текстов, обработанных специалистом предметной области. Если эта предметная область очень специфична (например, медицина или нефтегазовая отрасль), то предварительная обработка текстов требует квалифицированных специалистов и является затратной и растянутой во времени задачей.

В докладе большое внимание было уделено относительно новому в машинном обучении подходу. Этот подход появился с развитием глубоких нейронных сетей, он основан на следующей идее: нейронная сеть, обученная решению одной задачи, для которой существует очень большая обучающая выборка, затем применяется для решения другой родственной задачи в этой же области, но для которой доступна лишь совсем небольшая обучающая выборка. Это позволяет экономить время работы специалистов и использовать значительно меньший объем исходных данных для обучения модели. Подход хорошо зарекомендовал себя в области анализа изображений и компьютерного зрения. В 2017—2018 годах он более широко стал применяться и в компьютерной лингвистике.

Видеозапись выступления можно посмотреть на канале лаборатории аналитики потоковых данных и машинного обучения ММФ НГУ.

Источники

В НГУ состоялась встреча специалистов в области машинного обучения и анализа данных Open Data Science Siberia
Новосибирский государственный университет (nsu.ru), 01/04/2019

Похожие новости

  • 22/03/2018

    Андрей Помешкин: «Мы разрабатываем уникальные продукты в сфере информационной безопасности»

    ​Многократный лауреат межрегионального конкурса «Директор года. Предприятие года»,  его серебряный призер Андрей Александрович Помешкин —  один из основоположников развития направления информационной безопасности в регионе, основатель и руководитель одной из ведущих компаний ООО «Системы информационной безопасности», получившей признание на всероссийском и международном уровне.
    891
  • 08/07/2016

    Команда НГУ победила в межрегиональных открытых соревнованиях в области информационной безопасности

    ​С 26 по 28 июня на Алтае прошли очередные открытые соревнования по компьютерной безопасности AltayCTF-2016, в которых приняли участие 12 команд из Алтайского края, Новосибирска и Томска. Сборная команда студентов Новосибирского государственного университета заняла первое место.
    1219
  • 06/12/2016

    В НГУ пройдут курсы «Аналитика больших данных для бизнеса»

    ​Лаборатория аналитики потоковых данных и машинного обучения на базе НГУ и школа анализа больших данных «Экспасофт» открыли новый набор на курсы по машинному обучению и интенсивные курсы по аналитике больших массивов данных для бизнеса.
    1588
  • 13/07/2016

    Аспирант из Японии проходит стажировку в НГУ

    ​В начале июля аспирант японского Университета Айзу (University of Aizu, Aizu-Wakamatsu) Хаяси Кэнсаку приехал пройти стажировку на факультет информационных технологий. Он занимается разработкой сервисно-ориентированной среды для моделирования цунами.
    1200
  • 30/09/2016

    Аспиранты ФИТ представят НГУ в Японии на международной конференции

    ​С 6 по 8 октября в японском Университете Айзу (University of Aizu, Aizu-Wakamatsu) пройдет международная конференция, посвященная разработкам в области IT (Conference of Application in Information Technologies).
    1889
  • 19/05/2016

    Аспирантка НГУ - первая российская участница семинаров по цифровой гуманитаристике в Кембридже

    Аспирантка НГУ, сотрудница кафедры древних литератур и литературного источниковедения Ксения Грищенко приняла участие в курсе MMSDA-2016 (Manuscript Studies in the Digital Age 2016/Исследования рукописей в цифровую эпоху-2016).
    2062
  • 20/09/2018

    Как получить высшее образование в Интернете

    Несколько лет назад возможность получить высшее образование в Интернете казалась чем-то невероятным. Однако в последние годы онлайн-образование набирает обороты: курсы, прослушанные в Сети, начинают засчитываться в очных вузовских программах, школьники из российской глубинки получают знания прямиком из Гарварда, а российские университеты вовсю снимают собственные МООК (от англ.
    388
  • 12/10/2018

    21 студент новосибирских вузов отобран для подготовки по программе «Лаборатория Big Data»

    ПАО «ВымпелКом» (бренд «Билайн») объявляет о старте второго потока программы «Лаборатория Big Data» по подготовке магистрантов НГУ, НГТУ и СибГУТИ в области программирования и анализа больших данных в Новосибирске.
    464
  • 12/01/2018

    Лаборатория алгоритмики НГУ и TU Berlin разрабатывают новые способы эффективного сокращения объёмов данных

    Лаборатория алгоритмики ММФ НГУ и группа «Алгоритмика и теория сложности вычислений» Берлинского технического университета (TU Berlin) получили поддержку РФФИ и Германского научно-исследовательского общества (DFG) для проведения совместного научно-исследовательского проекта.
    955
  • 19/03/2019

    В НГУ состоится «Цифровая мультиварка»

    Экономический факультет НГУ 19 марта 2019 года в 16.20 проводит форум «Цифровая мультиварка» по теме: «Наследи! Как цифровой след ученого может помочь в его научной карьере». Ключевой спикер -  директор ГПНТБ СО РАН, кандидат технических наук Андрей Гуськов.
    115