​В рамках VII Международного форума технологического развития «Технопром» обсудили возможности использования больших данных для науки, бизнеса и государства. В настоящий момент все они нуждаются в эффективных цифровых инструментах для решения широкого круга задач.

Научный руководитель Иркутского научного центра СО РАН и директор Института динамики систем и теории управления им. В. М. Матросова СО РАН академик Игорь Вячеславович Бычков отметил, что современность тесно связана с хранением данных и их обработкой. «Мы живем в мире, где генерируется огромное количество цифровых данных, например, даже когда мы ничего не делаем с нашими мобильными телефонами, они всё равно определяют нашу геопозицию и таким образом создают большой массив информации», — сказал Игорь Бычков. Он обозначил ряд направлений, где особенно актуально стоит проблема работы с большими данными: отслеживание районов возгорания для предотвращения лесных пожаров, оптимизация транспортной системы с учетом переформатирования городской среды и так далее. «Закон Мура ставит перед нами сложные задачи, в первую очередь — возникает двоякая система: большие объемы данных требуют технологий для работы с ними, с другой стороны — технологии, которые разрабатываются, создают огромное количество информации для обработки», — считает Игорь Бычков.  
 
Участники дискуссии обозначили ряд сфер, где сейчас уже применяются большие данные и есть перспектива для более широкого их использования. В частности, вице-президент по развитию цифрового и нового бизнеса ПАО «Вымпелком» Джордж Хелд рассказал об использовании данных мобильных телефонов в поиске заблудившихся в лесу людей совместно с поисково-спасательным отрядом «Лиза Алерт». Начальник Центра коллективного пользования «Биоинформатика» ФИЦ «Институт цитологии и генетики СО РАН» Дмитрий Александрович Рассказов обозначил широту применения цифровых данных в исследованиях по биологии на разных уровнях: от отдельных молекул до целых популяций. Он привел пример работы искусственного интеллекта для выявления рака молочной железы: «Правильность предсказаний нейросети — 90 %, тогда как у человека в районе 40—50 %, — сказал он. — Биология — то, что активно использует большие данные и активно генерирует их. Если раньше можно было обрабатывать информацию вручную, то сейчас это не получается, необходимы новые подходы, которые применяли бы искусственный интеллект и машинное обучение, нужны специалисты, которые умеют работать с этими методами». Руководитель отдела «Машинное отделение» Центра финансовых технологий Иван Комаров дополнил, что перспективы использования этих технологий есть и в бизнесе. По его словам, машинное обучение позволяет бизнесу чувствовать себя более уверенно: на смену интуиции приходят решения, основанные на анализе большого объема данных. «Машинное обучение позволяет исследовать продукты и поведение клиентов по-новому. Кроме того, это — аппарат оценки, с помощью которого можно понять, насколько эффективен тот или иной процесс», — сказал он. Научный сотрудник Института ядерной физики им. Г. И. Будкера СО РАН кандидат физико-математических наук Александр Аркадьевич Король обозначил роль больших данных в работе крупных научных установок, например таких, как источник синхротронного излучения «Сибирский кольцевой источник фотонов» — СКИФ. Он пояснил, что сейчас запланировано создание локального вычислительного комплекса, но его мощностей на предполагаемый срок работы установки не хватит: «Локальный вычислительный комплекс требует порядка двух петабайт для хранения и пяти петафлопс вычислительной мощности. Однако этого объема хватит центру на месяц функционирования».  
 
Руководитель Сибирского суперкомпьютерного центра Института вычислительной математики и математической геофизики СО РАН кандидат физико-математических наук Игорь Геннадьевич Черных рассказал о ресурсах для научных целей, которые сейчас есть в Сибири. «Индустрия продвинулась в сфере высокопроизводительных вычислений и обработки данных. Например, появились “контейнеры”, которые дают возможность поместить в них данные пользователя и запустить на любом оборудовании. Если раньше код необходимо было адаптировать под разные машины, то теперь этого делать не нужно». 
 
Первый заместитель директора Института вычислительных технологий СО РАН кандидат физико-математических наук Андрей Васильевич Юрченко в совместном докладе с врио директора ИВМиМГ СО РАН доктором физико-математических наук Михаилом Александровичем Марченко рассказал о проекте «Сибирский национальный центр высокопроизводительных вычислений, обработки и хранения данных» — СНЦ ВВОД, который планируется реализовать в рамках программы «Академгородок 2.0». «Наука и ученые обладают необходимыми компетенциями для решения задач с большими данными, в том числе и по их размещению и использованию, — подчеркнул он. — Если раньше проанализировать информацию можно было вручную, глядя на экран, то сейчас это невозможно. Необходимы автоматические инструменты обработки и анализа». Андрей Юрченко отметил, что строительство СНЦ ВВОД в Академгородке обусловлено большим количеством крупных научных установок, которые будут нуждаться в высокопроизводительных вычислениях. «Новосибирск — центр сибирской науки и должен иметь такой ресурс, — считает А. Юрченко. — Проект включит в себя и образовательно-методический центр, который будет направлен на обучение пользователей». Вклад Сибири в развитие работ по большим данным подчеркнул и Джордж Хелд: «Традиционно самые хорошие математики из Новосибирска». Отвечая на вопросы из зала, Андрей Юрченко отметил, что при условии своевременного выделения необходимого финансирования СНЦ ВВОД начнет работу в конце 2022 года. 

Источники

Большие данные - большие вызовы
Наука в Сибири (sbras.info), 18/09/2019

Похожие новости

  • 16/04/2019

    Восемь ответов на частые вопросы о СНЦ ВВОД

    Зачем нужен Сибирский национальный центр высокопроизводительных вычислений, обработки и хранения данных — СНЦ ВВОД? Откуда придут деньги на его создание? Как этот проект связан с синхротроном СКИФ? С другими проектами «Академгородка 2.
    1821
  • 25/12/2019

    Сибирские ученые развивают проект СНЦ ВВОД

    ​Сибирский национальный центр высокопроизводительных вычислений, обработки и хранения данных (СНЦ ВВОД) — проект программы «Академгородок 2.0», который ориентирован на потребности научных институтов в работе с big data.
    1471
  • 24/03/2021

    У ЦКП СКИФ появится цифровой двойник

    ​У Центра коллективного пользования «Сибирский кольцевой источник фотонов», который сейчас находится на стадии подготовки к строительству, будет цифровой двойник. Он позволит координировать строительство, анализировать показатели функционирования синхротрона, осуществлять управление процессами, проверять сценарии работ и заблаговременно выявлять различные угрозы.
    510
  • 15/06/2017

    Институт вычислительных технологий создает новую систему хранения научных данных

    ​В ИВТ СО РАН запущена в тестовую эксплуатацию первая очередь новой системы хранения данных, которая строится на основе открытой платформы Ceph. Система предназначена для размещения, обмена и долговременного хранения научных данных.
    1446
  • 02/11/2020

    Под эгидой СО РАН строится метамодель распространения коронавируса в Новосибирске и Новосибирской области

    ​На совещании в правительстве региона под председательством первого вице-губернатора Юрия Федоровича Петухова ученые и чиновники определились с заказчиком самого востребованного на сегодня интеллектуального продукта и механизмом его создания.
    660
  • 03/02/2021

    Программа мероприятий, посвященных Дню российской науки

    ​Ежегодно 8 февраля российское научное сообщество отмечает свой профессиональный праздник — День российской науки. ​ По традиции к этой дате в институтах и вузах, находящихся под научно-методическим руководством Сибирского отделения РАН, приурочены научно-популярные мероприятия: дни открытых дверей, экскурсии, лекции и так далее.
    2406
  • 08/04/2021

    Как реализуется глобальный проект - синхротрон СКИФ?

    Идет подготовка строительной площадки, создается цифровой двойник Флагман проекта — центр коллективного пользования «Сибирский кольцевой источник фотонов» (СКИФ), который возводят в наукограде Кольцово, планируется запустить в 2023 году.
    527
  • 15/04/2021

    Руководство институтов СО РАН и компании Huawei обсудили перспективы расширения научно-технологического сотрудничества

     9 апреля 2021 года В Институте вычислительной математики и математической геофизики Сибирского отделения РАН (ИВМиМГ) состоялось совещание руководителей ряда институтов СО РАН с делегацией компании Huawei Technologies Co.
    1225
  • 05/10/2020

    Мусорные полигоны больше не нужны? О разработках Института теплофизики СО РАН

    Институт теплофизики СО РАН разработал и запатентовал комплекс технологий обращения с твердыми коммунальными отходами. С его помощью можно перерабатывать твердые коммунальные отходы без их накопления, а также рекультивировать перегруженные полигоны до состояния чистой земли.
    998
  • 03/10/2018

    Академгородок. Перезагрузка

    ​Новосибирск как центр развития науки будет перезапущен. В нем будет реализовано три мощнейших проекта и еще 22 «обыкновенных». Планируемая общая стоимость — примерно полтриллиона рублей. За настоящий прорыв.
    2952