​Два месяца пользователи активно обсуждают голосового помощника Алису, которую запустил Яндекс. Корреспондент Сиб.фм поговорил с руководителем офиса разработки Яндекса в Новосибирске Сергеем Бражником о её особенностях, эффективных трендах в разработке, а также о будущем, в котором вся рутина достанется машинам, а люди будут заниматься созидательной деятельностью.

-Последние два месяца по всей стране многие люди активно осваивают нового помощника, которого запустил Яндекс. Что тебе нравится в Алисе?

- В Алисе мне нравится то, что с ней можно разговаривать и что у нее есть характер. На это мы сделали ставку. Хочется, чтобы в дальнейшем это был устоявшийся человек. Пока же Алиса может сбиваться и иногда переходить в мужской или даже средний род, например. Это о том, что нужно доделывать. Но в целом у нее все очень хорошо получается.

Это не обидчивая Сири, Алиса умеет и постоять за себя. В моем представлении. Но у каждого свое.

Алиса - первый в мире виртуальный ассистент, который не ограничивается набором заранее заданных ответных реплик

Важно, чтобы с Алисой разговаривали, причем в двух направлениях. Первое - это непосредственно функции голосового помощника, когда люди спрашивают какие-то факты, просят что-то сделать, например, подсказать интересное место поблизости. Второе - это способ проводить время, когда людям нравится общаться с Алисой. Часто людям хочется чего-то жареного, поэтому Алису постоянно провоцируют на довольно колкие и острые моменты. Это история вполне нормальная, только нужен некоторый баланс, чтобы была возможность, с одной стороны, поддержать беседу и эту колкость оставить, а с другой - чтобы эти ответы никого не затрагивали, не были обидными и не приводили ни к чему плохому.

Идет очень большой поток информации от пользователей, потому что у нас есть возможность пометить каждый ответ Алисы - понравилось или не понравилось. Эти данные используются для анализа того, как она себя ведет, и для улучшения. Я думаю, что Алиса - это серьезный шаг в будущее, в котором мы все меньше будем касаться телефона и все больше использовать свой голос. Общаться с сервисами и в конечном итоге с роботами.

- Команда, работающая над Алисой, большая?

- Алиса - это продукт межсервисного взаимодействия: и Поиск, и Браузер, и диалоговая система, и большая команда голосовой технологии SpeechKit. Это ребята, которые умеют, с одной стороны, распознавать голосовые команды от пользователя, например: "Слушай, Алиса!" С другой - синтезировать голос. В основе лежит голос актера - в данном случае актрисы Татьяны Шитовой, которая в русскоязычном прокате озвучивает Скарлетт Йоханссон. Есть большой корпус слов, который актер наговорил, но потом их нужно правильно сочетать, склонять и синтезировать из них другие слова. В этом проекте много интеграций уже сейчас: можно, например, запустить музыку - "Алиса, поставь мне "We Will Rock You" Queen". Она найдет и запустит Яндекс.Музыку. Только для этого приложение должно быть установлено. В будущем, будем надеяться, появится интеграция всех наших сервисов с инфраструктурой телефона.

- А не по работе в каких случаях ты пользуешься помощью Алисы?

- Я использую ее для того, чтобы спрашивать разные факты. Последнее, например, про разные болезни. У меня устали глаза, поэтому я интересовался болезнями глаз. А вообще мы с дочками балуемся - спрашиваем Алису про всякие штуки. Так как девчонки у меня небольшие - шесть и десять лет, - они воспринимают ее как человека, особенно младшая хочет с ней болтать. Алиса понимает, конечно же, только половину из того, о чем с ней болтают, и иногда получается довольно весело.

Вообще наши семейные кейсы чаще всего связаны со сказками, песнями и шутками, которые хочется послушать. Алисе здесь есть куда расти.

В частности, у нее сказки довольно-таки взрослые. Я думаю, над этим мы тоже поработаем: они станут более мягкими, шелковистыми - специально для детей.

- В Новосибирске пока никто из разработчиков не занимается Алисой?

- Да, Алисой полностью занимается команда в Москве и немного в Минске. В Новосибирске ребята занимаются инструментами машинного обучения. И Алиса, и наш Поиск, и рекомендации в Музыке, да и другие наши сервисы - все это построено на каких-то инструментах машинного обучения. Поэтому у нас есть группа, которая занимается разработкой и сопровождением этих инструментов. Публично известным инструментом является MatrixNet, на основе которого работает, в частности, Поиск. И пришедший ему на замену CatBoost, который мы выложили в открытый доступ в июле 2017 года. Поэтому в Новосибирске ребята вместе с командой из Москвы разрабатывают дальше CatBoost, поддерживают MatrixNet и постепенно внутри делают переход с одного на другой.

Но вообще в Яндексе в плане карьеры нет границ в деятельности: можно периодически переходить от департамента к департаменту, менять проекты. Чтобы ты влился в команду, принес пользу и потом, возможно, сказал: "Ну все, ребята, я хочу чего-то нового". Поэтому любой человек, который знает, как помочь, может, например, прийти в команду Алисы. Рук всегда не хватает. Команды постоянно расширяются, и все наши вакансии есть в открытом доступе. В принципе в сфере IT всегда есть множество проектов, которые, можно сказать, лежат на полу.

Так что у нас есть понятие внутреннего найма и ротации. Я тоже сам себя ротировал. Получается, первый год я занимался развитием новосибирского офиса, а потом - развитием всех региональных офисов разработки. Екатеринбург, Нижний Новгород, Симферополь, частично Санкт-Петербург, Иннополис, Минск. Моей задачей был рост офисов и увеличение количества разработчиков в регионах. Вскоре понял, что организовывать и растить умею, но мне хочется заниматься еще и программированием, из которого я изначально и пришел. Захотел вернуться к корням, к истокам. И у меня получилось.

Сейчас я все региональное управление отдал коллегам, эйчарам, а сам руковожу новосибирским офисом и с августа являюсь менеджером команды, работающей над инструментами машинного обучения. Пишу код, как и хотел. У меня есть возможность подумать, а не проводить время в постоянном планировании, синхронизации - стратегических вещах. Это круто, я к этому вернусь. А пока хочу принести другую пользу.

- Расскажи, пожалуйста, подробнее, чем отличаются друг от друга инструменты машинного обучения - MatrixNet и пришедший ему на замену CatBoost?

- MatrixNet - наша рабочая лошадка, которая выручала в течение десяти лет. Это проверенный алгоритм, который работает очень хорошо. Но не надо стоять на месте, все-таки программирование всегда находится рядом с наукой, с академическими работами, которые улучшают качество и алгоритмов, и прогнозов, и машинного обучения.

Все базовые алгоритмы на самом деле придуманы в 60-х - 70-х годах. Их не старались совершенствовать в теории, потому что на практике было сложно исполнить из-за недостаточной мощности компьютеров. Например, новая версия алгоритма даст плюс пять процентов к точности предсказания. Но для того чтобы этот алгоритм запустить, нам потребуется, допустим, еще сто серверов. А это очень большие затраты!

Был такой подход: "Ой, как много, мы пока этим не будем заниматься, потому что сервера дорогие".

А сейчас сто серверов для средних и больших компаний - не такая большая проблема, зато пять процентов качества - отличный показатель и конкурентное преимущество.

CatBoost - это новый виток MatrixNet: у него выше качество, точность и более широкий инструментарий. В какой-то момент мы решили поделиться нашей разработкой с миром - программистами и исследователями в области машинного обучения. Мы используем CatBoost для себя, внутри, поэтому понимаем, в чем его неудобство и стараемся сделать его лучше. Кстати, беда многих стартапов, которые погорели, как раз в том, что они сами не пользуются своими разработками, думают, что знают поведение аудитории, а на самом деле все иначе, не так, как представляли.

- Нужно все посмотреть на практике?

-Безусловно. Например, у нас в Яндекс.Картах есть разговорчики - возможность написать какой-то комментарий, который будет сопровождать геометку. Казалось бы, простая история, а по большому счету это дорожная социальная сеть. В Москве это прям способ общения людей, которые постоянно стоят в пробках.

Даже разработчики Навигатора и Карт, непосредственные пользователи своих продуктов, не предполагали, что такая небольшая фича может использоваться как настоящая соцсеть. Это положительный пример.

- Подобные сервисы вы запускаете не только в России, но и за рубежом?

-Мы экспериментируем в разных странах с небольшими сервисами, уже не поисковыми. Например, в Финляндии запустили Яндекс.Транспорт. Интернациональный продукт - персональная лента рекомендаций Яндекс.Дзен. Ее можно назвать "Фейсбуком" наоборот.

Если в "Фейсбуке" ты видишь то, что публикуют твои друзья, и то, что интересно им, то Дзен - то, что интересно тебе. В Яндексе есть фича: если набрать любой запрос и нажать Enter, а потом удалить запрос, то появятся близкие к нему запросы

Он собирается с истории твоих просмотров других сайтов, но каждый раз тебе подмешивается что-то новое, чтобы интерес не пропадал.

Еще у нас есть интересная история, связанная с Турцией. В какой-то момент мы решили, что нужно попробовать сделать поиск для людей с неславянским языком, потому что турецкий совсем другой. Он не похож ни на английский, ни на русский. Этот эксперимент длился довольно долго: мы запустили Турцию уже больше шести лет назад, потратили довольно много денег, но получили интересный опыт с точки зрения качества продукта. Хороший результат выдачи - лучше, чем у Google, который является там основным конкурентом.

Но мы столкнулись с тем, что люди привыкают к чему-то. Если у тебя продукт чуть-чуть лучше, на 5-10 %, то это не сильно значимый плюс для того, чтобы с уже давно используемого конкурента перешли на тебя. Зато в Турции мы считаемся геосервисной компанией: зашли на рынок и принесли свои геосервисы.

Поэтому любой турок знает, что такое Яндекс.Навигатор и Яндекс.Карты. И Google с этим уже ничего не может поделать. Даже сейчас, когда они значительно подтянули качество своего продукта. Яндекс и Google - лидирующие в рунете по популярности поисковики

Вообще мировых поисковых компаний не так много (Google, Miсrosoft Bing, Yahoo), а дальше остаются локальные, которые хорошо локализованы и понимают свой рынок, например Baidu в Китае, Naver в Южной Корее и Яндекс в России. И, собственно говоря, где ничего своего нет - есть Google.

Основной поисковый рынок Яндекса - это, конечно, Россия. И ближайшее русскоговорящее зарубежье: нам интересны рынки Белоруссии, Казахстана, других постсоветских республик.

- Яндекс, в частности, в Академгородке интересует зарубежные медиа, например, недавно у вас брали интервью немцы. Они хотели сделать сюжет об Академгородке как о сибирской Кремниевой долине. Чем, на твой взгляд, Академгородок притягивает иностранцев?

- Академгородок - это научный кампус, аналогов которому в России не так уж много.

Зеленоград и какие-то еще закрытые города, как правило, имели образовательную базу (в нашем случае это университет) и научные институты, которые являлись заказчиками. Раньше каждая лаборатория института имела свою кафедру в университете. Этот подход с наступлением 90-х годов, конечно, поменялся.

В Академгородке сильная научная и инженерная база. Сейчас, кроме институтов, есть еще IT-компании и бизнес в целом. Надо заметить, что в какой-то момент произошел некоторый дисбаланс, потому что бизнес чаще всего преподавать не желает, а нанимать хочет. Яндекс, в частности, выделяется тем, что мы любим как раз и преподавать тоже. У нас есть глобальная программа - Школа анализа данных. Рассказываем и учим важным вещам о машинном обучении и анализе данных - эти темы сейчас "на волне" общего интереса. В Новосибирске Школа анализа данных существует, как направление в Computer Science Center, который мы развиваем совместно с компанией JetBrains на базе НГУ.

Хорошо, что есть технопарк. Всем хочется здесь открыть свой офис, от этого бизнес становится все конкурентнее. Тем не менее все новые и новые игроки приходят. Зарплата у айтишников от этого понемногу растет, быть программистом все еще модно. Лет десять назад мода началась и, думаю, еще продлится десяток-другой лет.

Если школьникам сейчас нравится математика, информатика, то многие выбирают программирование в качестве будущей профессии. Это правильно.

- Ты следишь за сферой IT много лет: есть примеры чего-то, что тебе когда-то казалось далеким будущим, но уже воплотилось?

- Когда я учился в Высшем колледже информатики, у меня появился персональный компьютер. Конечно же, родители на нем работали, но я тоже мог что-то делать. Тренировался - ставил программы, которые распознавали голос. У меня была идея фикс - управлять компьютером с помощью голоса: включись, выключись, запусти Office или Turbo Pascal, на котором программировал. И чтобы он меня понимал и соответственно работал. Но в то время, к сожалению, мощности компьютеров не хватало на то, чтобы понимать голос, кроме нескольких фраз. Он мог обычно уловить простые слова, причем на английском: yes, no, open, поэтому Open Office понимал. А все остальное, например "Скажи, сколько сейчас времени?", было из разряда фантастики.

Это было больше двадцати лет назад. За это время очень сильно развились технологии: сейчас алгоритмы легко могут распознать, что говорит человек, проанализировать, как-то отреагировать. Кроме того, мне всегда было интересно, как сделать так, чтобы машина поехала сама. Я, начиная со школьной скамьи, когда учился ездить за рулем, интересовался, почему у нас роботы еще не ездят, не управляют машинами? А сейчас, опять же, и мощности, и технологии подошли к тому, что мы экспериментируем с этим.

В подразделении Яндекс.Такси есть ребята, которые занимаются такими "самоездящими машинками" - беспилотниками. На 20-летие Яндекса приезжал президент Владимир Путин: мы ему показывали, как машина сама поехала. Перед застекленным подъездом она вовремя остановилась, сама развернулась и приехала обратно.

В общем, действительно, машины сейчас умные, сами ездят, а водители нужны скорее из соображений страховки - мало ли что.

Я думаю, на нашем веку они поедут полностью самостоятельно. Будем садиться уже в такое такси. Может быть, это и останется "седан баклажан", но уже без веселого таксиста внутри, ну или он станет виртуальным.

- Сейчас много говорится вообще о машинном интеллекте. Что больше относится к области настоящего, а что к области будущего, которое вы считаете наиболее реальным?

- Сейчас машины отлично умеют решать узкие задачи, которые требуют специализации. Вождение, распознавание речи - все это можно сделать с помощью искусственного интеллекта. Еще, например, возможно распознавание рака по клеткам крови. В медицине существуют специалисты в лабораториях, которые всматриваются в мазок крови и ищут что-то несвойственное. Алгоритмы могут решать такие задачи лучше, чем человек, потому что алгоритм может "увидеть" миллионы мазков и потом принимать решение, а человек за всю свою жизнь столько не увидит.

Таких сфер, где эффективнее использовать не человеческие ресурсы, а машинный интеллект, будет становиться все больше, но это не значит, что скоро программы заменят человека. Их применение очень точечное, так что восстание машин пока только в фильмах. Другое дело, что многие машинные алгоритмы нужно использовать с оглядкой на то, что они практически все работают с обобщениями. Например, скоринговая система в банках принимает решение выдать кредит на основе информации о клиенте. Учитываются такие данные, как официальный доход, что есть в собственности, семейное положение, работает ли супруг или супруга, сколько детей и так далее. Это алгоритм принятия решения.

Конечно, чем человек состоятельнее, тем с большей долей вероятности он получит кредит. Но всегда бывают какие-то крайние случаи, когда человек легко вернет деньги, ему они нужны ненадолго, например, перекредитоваться. А алгоритм будет считать, что он несостоятельный. Такое тоже бывает. И про это стоит помнить.

Если людей начинают по их анкетным данным - пол, возраст, место рождения, национальность - классифицировать, то, с одной стороны, это хорошо. Делается для полезных целей, допустим, для выявления потенциальных нарушителей правопорядка. Но с другой стороны, все такие данные - это обобщение большого объема информации, а конкретный случай конкретного человека может туда не попадать. Тогда его могут обвинить в чем-то, хотя это не так. Поэтому такие морально-этические моменты в машинном обучении уже являются реалиями нашей жизни: нужно аккуратнее обращаться с информацией.

-Какие сейчас самые распространенные тренды в сфере разработки?

-Если говорить прям о хайпе, то это блокчейн. Но в Яндексе мы им не занимаемся. Это не технология, а скорее инструмент. В тренде сейчас, конечно, машинное обучение и все, что с ним связано.

-Какая функция кажется тебе настоящей магией?

- У приложения Яндекса есть замечательная функция - поиск похожих картинок. Приложение фотографирует, например, твой диктофон. И тут же Яндекс ищет и предлагает картинки всего, что похоже на этот диктофон, причем картинки могут быть даже не подписаны, то есть наш искусственный интеллект понимает, что на них изображено. Это магия - сфотографировал и узнал, что это такое.

Компания Apple выпустила iPhone X c технологией FaceID, когда у тебя телефон разблокируется по взгляду, по форме лица. Тоже очень круто!

-Мы поговорили о том, что казалось тебе далеким будущим двадцать лет назад и осуществилось сейчас. А чего пока у нас нет, но тебе бы хотелось, чтобы это появилось?

- Я не верю, что в ближайшей перспективе - десяток лет - машинное обучение создаст полноценный искусственный разум. Что машина себя осознает: сначала появится Скайнет, потом будет у нас матрица. Все не понимаю, почему не сошьют два этих фильма. Одно в другое логично перетекает. Для того чтобы машина получила сознание, еще очень много нужно сделать. И это на самом деле не требуется. Машина должна хорошо решать какие-то определенные задачи, думать глобально ей не надо.

Есть человек, который должен думать. Машина - лишь помощник. Неважно, определяем ли мы наличие рака в крови или сортируем почту. Именно поэтому я надеюсь, что в нашей жизни будет все больше и больше применения машинного обучения.

Пусть уже машины сами поедут - и с экономической точки зрения, и экологической. Чтобы по всему городу была хорошая логистика и мы не гоняли по одной машинке на одного человека.

Чтобы можно было в будущем вообще не иметь машины: всегда - вышел, сел в такси и поехал. Конечно, пока телепорт не изобрели.

Чтобы не париться с тем, что нужно помыть или переобуть машину. При этом параллельно в пути поговорил со своим голосовым другом, попросил настроить свой умный дом, чтобы, когда ты приехал, были подогреты тосты, куплена колбаса, например, и чайник вскипел.

Хочется, чтобы мы пришли к чему-то такому: человек занимался бы какой-то созидательной деятельностью, а машины ему в этом помогали. То есть такие неинтересные вещи, как покупка продуктов питания, можно было бы автоматизировать. Всю рутину - машинам. К этому нужно стремиться. В Яндексе мы для этого довольно много прилагаем усилий. Все, что я рассказал, надеюсь, произойдет постепенно, не будет взрывом. Система "умный дом" начинает распространяться. Все будет появляться понемногу и накручиваться, как снежный ком.

Конечно, сейчас я понимаю, что мои попытки общаться с компьютером двадцать лет назад были смешными. Но за эти годы произошел громадный скачок. Я верю, что в ближайшие 10-20 лет будет множество улучшений и изменений в нашей жизни. Мы будем всем этим пользоваться. В некотором смысле у нас будут расти аппетиты в этой сфере. Будем все нововведения воспринимать органично. Мало кто будет рефлексировать, что 30 лет назад про это вообще думать нельзя было.

В общем, я футурист, который исключительно прагматичен: роботы должны помогать людям. А мы должны созидательно обобщать все, что происходит вокруг, делать мир лучше. В конце концов, мы же, наверное, здесь за этим.

Мария Тищенко

Источники

Через нейросеть к созерцанию
Сиб.фм (sib.fm), 11/12/2017

Похожие новости

  • 13/06/2018

    Интернет вещей изменит промышленность и нефтедобычу

    ​Интернет вещей обычно вспоминают, когда речь заходит о комфорте повседневной жизни. "Умный дом" определит, когда нужно купить продукты, и сам сделает заказ в интернет-магазине, а фитнес-браслет, заметив изменения пульса, запишет владельца ко врачу.
    347
  • 26/03/2018

    Как объединить блокчейны

    На сегодняшний момент набралась критическая масса знаний и информации, придуманных решений, которые могут быть как-то использованы в экономике. Единственное, что стоит сделать в первую очередь, это все-таки поменять подход.
    493
  • 13/06/2018

    В НГТУ открылась магистратура для «Умных городов»

    Факультет бизнеса Новосибирского государственного технического университета (ФБ НГТУ) объявил набор на новую магистерскую программу "Цифровые технологии в государственном и муниципальном управлении", сообщили в пресс-службе университета.
    321
  • 19/03/2015

    Что вырастим, то вырастим: 3D-индустрия

    ​В стакан с песком мы кольцами, одно поверх другого, наливаем клей, он застывает, затем снова и снова льем клей и подсыпаем песку... Потом отряхиваем лишнее и получаем нечто вроде трубы. Заменим песок специально подготовленным порошком из металла, керамики или композита, струйку клея - лучом лазера или потоком электронов, а собственную руку - системами точного, до микрон, позиционирования и интеллектуального управления.
    1116
  • 19/11/2018

    Биолог из Новосибирска разработал мобильное приложение для сельского хозяйства

    Труд агрономов и селекционеров иногда содержит очень утомительные операции. Например, периодически им требуется подсчитывать количество зерен в колосьях пшеницы. Не делать этого вручную позволяет мобильное приложение SeedCounter, которое вместе с коллегами создал биолог Михаил Генаев из Новосибирска.
    96
  • 22/11/2017

    Новосибирские ученые разработали софт для ускорения майнинговых вычислений

    Компания Mining Solutions, основанная выпускниками Новосибирского госуниверситета, разработала софт, значительно повышающий скорость расчетов и снижающий энергопотребление майнингового оборудования. Об этом журналу ForkLog рассказали представители компании.
    634
  • 13/12/2016

    В НГУ создают новые программы для детей с нарушениями речи

    Логопеды детского сада № 97 третий год сотрудничают с Новосибирским государственным университетом. На кафедре фундаментальной и прикладной лингвистики НГУ создают новые программы, которые помогут детям с нарушениями речи.
    1195
  • 22/06/2017

    Участники «Технопрома» - о развитии и применении искусственного интеллекта

    ​Глубинное обучение (Deep Learning) - область машинного обучения, которая активно развивается последние годы. Конечно, это не тот искусственный интеллект, который представляют себе фантасты, но уже сегодня многие алгоритмы решают задачи биомедицины, машиностроения, обработки естественного языка.
    786
  • 25/10/2018

    Бизнес-ускоритель А:СТАРТ вовлекает школьников в инновационную сферу

    ​Начала работу осенняя сессия бизнес-ускорителя А:СТАРТ, программы Академпарка по отбору и развитию новых инновационных команд.  Новые подходы были внедрены уже на ранних стадиях подготовки: с мая Академпарк запустил преакселератор А:СТАРТ – серию открытых занятий, где потенциальные участники получали базовые знания об особенностях сферы технологического предпринимательства, о правилах оформления проектов, об эффективных методах презентации и др.
    85
  • 13/04/2016

    В ИЦИГ СО РАН создают базу данных для обработки научной информации

    ​В Федеральном исследовательском центре «Институт цитологии и генетики СО РАН» разрабатывают универсальную систему для поддержки селекционно-генетических экспериментов, пока что тестируя ее на проектах, связанных с изучением пшеницы.
    1489