​​Насколько устойчивы традиции русской поэзии? Влияет ли размер стихотворения на содержание? Еще в 1960-х годах американский филолог-славист Кирилл Тарановский высказал предположение о связи формальных характеристик стиха с его жанром. Например, лермонтовское «Выхожу один я на дорогу…» написано пятистопным хореем. Те же размер и строфика характерны для «Вот бреду я вдоль большой дороги…» Федора Тютчева, «Вот я выхожу, открытый взорам…» Александра Блока, «Гул затих. Я вышел на подмостки» Бориса Пастернака. Эти стихотворения объединены общим жанром – раздумья идущего героя о жизненном выборе. К.Тарановский предложил методику определения семантики того или иного стихотворного размера, заключающуюся в исследовании не единичных употреблений, а традиции его жанрового и тематического использования, что предполагает анализ целых корпусов русских поэтических текстов. Естественно, такой подход требует автоматизации. И полвека спустя на помощь лингвистам пришли программисты – в Институте вычислительных технологий СО РАН, недавно ставшем Федеральным исследовательским центром, реализуется поддержанный Российским научным фондом проект «Разработка и реализация информационной системы многоуровневого исследования стихотворных текстов».

– Наша задача – освободить исследователей от рутинной работы, – рассказывает руководитель проекта доктор технических наук Владимир Барахнин. – Впервые будут предложены алгоритмы исследования взаимозависимости фонометрического и лексико-тематического уровней стихотворных текстов. Проще говоря, программа поможет выявить и провести количественный анализ связи смысловых ассоциаций со стихотворными размерами. Причем может быть исследован такой массив текстов, обработать который филологу-одиночке попросту не под силу. Автоматизация позволит расширить круг исследуемых авторов. Чтобы полностью автоматизировать анализ русской классической поэзии XIX-XX веков, необходимо составить метрические справочники к корпусу стихов того или иного поэта, содержащие сведения о системах стихосложения, размерах, каталектике (ритмических окончаниях стихов), строфике, метрической композиции стихотворений. Кроме того, понадобятся словари рифм, конкордансов (алфавитных перечней всех слов текста с указанием контекстов их употребления) и статистические словари слов и словосочетаний, употребляемых как отдельными поэтами, так и представителями определенных литературных направлений. Эти справочники и словари важны и для непосредственного изучения художественной техники поэта, и в качестве основы для проведения количественного анализа связей содержания текстов со стихотворными размерами.

Пытаясь перелопатить этот поэтический пласт, специалисты ИВТ неожиданно помогли сотрудникам библиотек – в ходе работы над проектом был создан алгоритм для перевода старой орфографии в современную. При оцифровке дореволюционного издания можно будет преобразовать текст в привычный для сегодняшнего читателя вид. Работа над программой осложнялась тем, что до середины XX века в русском языке не было официально утвержденной орфографии.

– До революции появлялись орфографические справочники, на их основании писались гимназические грамматики, но нормы не были кодифицированы. Декрет Совета народных комиссаров от 10 октября 1918 года «О введении новой орфографии» был весьма краток и описывал то, что требует изменения, причем далеко не полностью. Например, вышло так, что ижица (Ѵ) вообще не была упомянута, – поясняет В.Барахнин. – Для разработки программы за основу был взят «Справочник по старой орфографии русского языка» П.И.Давыдова, изучившего и проанализировавшего значительное количество источников и литературы, в том числе учебники, словари и справочники, изданные в старой орфографии до 1917 года. В этом справочнике изложен ряд изменений, которые можно разделить на две большие категории: правописание морфем (приставок, падежных окончаний) и употребление отдельных букв. На основе перечисленных в справочнике норм дореволюционного правописания был разработан переводчик.

Скажем, нужно выяснить современное написание слова «тростiю». Казалось бы, все просто: для этой группы окончание должно быть заменено на «-ью» – тростью. Однако такое же окончание может иметь и слово «эволюцiю».

алгоритм перевода.jpg

– В первом случае в результате применения правила перевода, мы получим верный результат – тростью. В ситуации со вторым словом получится несуществующая лексема – эволюцью. Наш алгоритм, проанализировав результат работы морфологического анализатора, увидит это и отменит примененное правило, после чего на втором этапе перевода произойдет замена устаревшей «i» на современную «и» и мы получим верный перевод – эволюцию, – рассказывает магистрант механико-математического факультета НГУ, инженер-программист ФИЦ ИВТ Елизавета Тагирова.
– Конечно, неизбежно останутся такие случаи, в которых эксперт должен будет решать, правильно сделан перевод или нет, – объясняет старший научный сотрудник ФИЦ ИВТ, кандидат филологических наук Ольга Кожемякина. – Например, в слове «концемъ» («концом» в современном виде) алгоритм видит окончание и не подозревает, что это какая-то устаревшая морфема. Он просто убирает «ъ» на конце, но этого недостаточно. Этот пример не попадает в какую-либо категорию написания морфем, участники проекта не нашли такого ни в одном справочнике. Предположительно написание объясняется тем, что когда-то «ц» обозначала мягкий звук. Чем старее текст, тем больше можно найти подобных примеров, требующих вмешательства эксперта в силу того, что не все правила кодифицированы: в печатном слове традиции и инерция намного сильнее, чем в живой речи. Мы допускаем, что на тот момент люди уже говорили «концом», а писали все еще в соответствии с традицией печатного слова. В культуре того времени печатные издания выступали эталоном.
Так что в данном случае компьютер заменяет не ученого, а, скорее, корректора. Пока программа еще не способна анализировать случаи, которых нет в справочниках. Но в случае спроса – например, со стороны библиотек с большим объемом дореволюционной литературы – ее возможно доработать.

Подобные проекты стимулируют междисциплинарное сотрудничество, традиционно характерное для институтов Сибирского отделения РАН.
– В чем главные достоинства данного проекта РНФ? Прежде всего он позволил интегрироваться в одну команду специалистам по информационным технологиям и филологам – профессиональному пушкинисту Ольге Юрьевне Кожемякиной, заведующей кафедрой фундаментальной и прикладной лингвистики Гуманитарного института Новосибирского государст-венного университета, доктору филологических наук Марии Кирилловне Тимофеевой, – подчеркивает В.Барахнин. – Я занимаюсь компьютерной лингвистикой с начала 2000-х годов, сотрудничал с коллегами из Казахстана, помогал им развивать методы обработки информации на казахском языке. Сейчас вместе с магистрантами НГУ из Узбекистана решаю аналогичную задачу для узбекского языка. Но наш проект помог мне осуществить давнюю мечту – реализовать в исследованиях интерес к русской классической поэзии, зародившийся еще в школе. В нашей области исследований не нужны ни специальное оборудование (прекрасные компьютеры есть в федеральном исследовательском центре), ни расходные материалы, поэтому второе преимущество проекта я вижу в том, что он дает возможность привлечь к работе достаточное количество аспирантов, причем самых разных специальностей: математиков, программистов, лингвистов. В нашей команде много недавних выпускников НГУ, и благодаря поддержке РНФ они могут сосредоточиться на исследованиях и подготовке к защите кандидатской диссертации, не думая ежедневно о хлебе насущном. Дополнительным бонусом становятся командировки и участие в конференциях. Фактически наша команда работает следующим образом: генерируют идеи более опытные участники – М.К.Тимофеева, О.Ю.Кожемякина, ваш покорный слуга – а их практической компьютерной реализацией занимается молодежь – аспиранты и магистранты.
Проект Российского научного фонда по многоуровневому исследованию стихотворных текстов рассчитан на 2019-2021 годы. За 2019-й кроме вышеупомянутого автоматического переводчика дореволюционных текстов с учетом морфологии слов были разработаны алгоритм автоматического определения стопности, определяющий, в частности, рифму в стихотворениях А.С.Пушкина с точностью в 95%, а также реализованный в виде веб-приложения алгоритм построения конкордансов. Надо сказать, это – тот случай, когда количество переходит в качество: радикальное увеличение объема анализируемого корпуса русских поэтических текстов должно вывести филологические исследования на новый качественный уровень. Первыми кандидатами на «поверку гармонии алгеброй» выбраны Алексей Константинович Толстой и Иннокентий Федорович Анненский. Именно их творчество подвергнется комплексному анализу с использованием разработанных ФИЦ ИВТ алгоритмов. 

Ольга Колесова

Похожие новости

  • 19/05/2016

    Аспирантка НГУ - первая российская участница семинаров по цифровой гуманитаристике в Кембридже

    Аспирантка НГУ, сотрудница кафедры древних литератур и литературного источниковедения Ксения Грищенко приняла участие в курсе MMSDA-2016 (Manuscript Studies in the Digital Age 2016/Исследования рукописей в цифровую эпоху-2016).
    2887
  • 07/12/2017

    Новосибирские ученые предположили, что животные показали древнему человеку пути миграции

    Команда Центра «Новая Археология» НГУ и Института археологии и этнографии СО РАН совместно с коллегами из Американского университета Центральной Азии, Кыргызского национального университета и Университета Торонто обнаружили уникальную пещеру в Алайской долине, которая является первым многослойным памятником региона: здесь содержатся культурные останки от современности до каменного века.
    1802
  • 16/11/2017

    Intel проведет в НГУ первый День искусственного интеллекта в России

    ​Корпорация Intel и Лаборатория высокопроизводительных вычислительных систем ФИТ НГУ проведут в НГУ семинар-воркшоп Intel Artificial Intelligence Day. Новая серия мероприятий Intel проходит в ноябре-декабре в ведущих университетах мира — НГУ стал первым российским вузом, где состоится подобный семинар.
    1544
  • 12/08/2019

    В Новосибирске разработали автономную систему сбора данных по экомониторингу

    ​Новосибирские разработчики создали автономную систему сбора данных с датчиков экологического мониторинга, которая отличается от применяемых систем тем, что не требует ручного сбора информации с приборов, а также способна отслеживать точное местоположение датчиков и время показаний, кроме того, систему можно применять в энергетике и других отраслях.
    743
  • 28/10/2016

    Археология как основа партнерских отношений

    ​Профессор Китайского университета Гонконга Тан Чун, возглавляющий Центр археологии и искусства Китая, выступил перед студентами НГУ с лекциями, посвященными исследованию нефритовой культуры Китая и созданию ткани из луба в регионе Юго-Восточной Азии.
    2854
  • 07/12/2017

    ФИТ НГУ и Intel провели первый День искусственного интеллекта в России

    ​Более 180 человек стали участниками семинара-воркшопа Intel Artificial Intelligence Day, прошедшего в НГУ. Artificial Intelligence (Deep Machine Learning) Workshop — это новая серия мероприятий, которые корпорация Intel проводит в ведущих университетах мира с ноября 2017 года.
    1546
  • 07/02/2019

    Междисциплинарный международный проект АлтГУ получил поддержку РФФИ и Национального центра научных исследований Франции

    ​Накануне Дня российской науки были подведены итоги совместного конкурса РФФИ – Национальный центр научных исследований Франции. Среди победителей проект опорного Алтайского государственного университета «Лошади и их значение в жизни древнего населения Алтая и сопредельных территорий: междисциплинарные исследования и реконструкции».
    875
  • 10/10/2019

    Всероссийская научно-практическая конференция «Информационно-телекоммуникационные системы и технологии (ИТСиТ-2019)»

    В КузГТУ 10 октября начнет работу Всероссийская научно-практическая конференция «Информационно-телекоммуникационные системы и технологии (ИТСиТ-2019)». Организаторы мероприятия: Кузбасский политех, Институт вычислительных технологий СО РАН, Институт экономики и организации промышленного производства СО РАН, администрация Кемеровской области, Международный научно-образовательный центр технического университета – Arena Multimedia и Западно-Сибирский научный центр.
    761
  • 06/10/2017

    Новосибирские археологи исследуют «шелковый путь» каменного века

    Команда центра «Новая археология» НГУ совместно с Институтом археологии и этнографии СО РАН исследуют Эшме-Тоо — горный хребет на юго-западе Кыргызстана, на котором выявлены десятки археологических памятников.
    2540
  • 16/11/2017

    Новосибирские археологи вернулись с франко-российского научного форума по археологии каменного века

    ​Конференциия была организована Институтом археологии и этнографии СО РАН и Национальным музеем доисторической эпохи в городе Лез-Эйзи-де-Тайяк-Сирей (департамент Дордонь), в котором с июля по ноябрь 2017 года демонстрировались более трехсот артефактов из Денисовой пещеры, а также пещер Чагырской, Окладникова, древних стоянок Кара-Бом и Усть-Каракол Среди них были каменные орудия, украшения из кости, скорлупы яиц страуса и поделочного камня, а также несколько небольших фрагментов костей самих обитателей пещеры.
    3553