Искусственный интеллект VS машинное обучение: проигравших нет
22.10.2018

Управляющий директор лаборатории Сбербанка по искусственному интеллекту Максим Савченко рассказал участникам форума U-NOVUS о том, как наряду с прикладными задачами Сбербанк решает социальные проблемы, применяя технологии искусственного интеллекта (ИИ). Основные тезисы лекции записала Екатерина Криволапова.

Модели для решения социально значимых проблем

Лаборатория по искусственному интеллекту, созданная в Сбербанке год назад, сегодня не ограничивается решением задач, значимых для банковской деятельности.

– То, чем занимается лаборатория, это, по сути, прикладная математика, которая и раньше в Сбербанке была работающим инструментом, – сказал Максим Савченко. – Важно, чтобы в банке были люди, способные правильно поставить задачу.

Исследовательская структура внутри банка готова создавать работающие модели для решения социально значимых проблем, в частности, медицинских. Эксперт привел пример: в удаленных районах была выявлена проблема нехватки квалифицированных экспертов для диагностики типа инсульта. В зависимости от типа, инсульт лечится совершенно разными и даже противоположными методами, и выбор метода во многом определяет исход лечения. Медики предоставили лаборатории Сбербанка снимки с разными типами инсульта. Весь объем данных был внесен в машину, которая обучилась распознавать типы и даже давать рекомендации по лечению.

Следующим шагом могла бы быть интеграция работающей модели с томографом, а далее – закупка таких «специально обученных» аппаратов для конкретных больниц, в том числе в районах. Но, по мнению Савченко, на данном этапе возникает главная трудность: реализация становится слишком дорогостоящей, и за нее некому заплатить. Таким образом, есть работающая модель, но применить ее пока не представляется возможным.

– Если нет операционной структуры, куда будет встраиваться модель, то выхлоп у всех научных изысканий нулевой, – уверен Максим Савченко. – Вот на что нужно обращать внимание! У нас в стране значительная часть исследований основана на энтузиазме и не подкреплена реальным практическим запросом.

В свою очередь, директор межрегионального супервычислительного центра ТГУ Сергей Орлов подтвердил важность данных, которые можно собрать:

– Сегодня дефицит уже не в технологиях, а в данных, которые мы можем получать. Решая эти вопросы, мы создали консорциум университетов по большим данным: предполагается обмен данными между университетами, чтобы на основе этих сведений строить работающие математические модели.

Об основных инструментах работы с большими данными

Максим Савченко также рассказал о способах работы с большими данными. Два основных инструмента – искусственный интеллект и глубинное машинное обучение. Каждый метод хорош для своих задач: не может быть универсальной «таблетки», позволяющей решать абсолютно все задачи одним методом.

Сегодня в банке аккумулируется огромное количество данных, в том числе о клиентах. Раньше решения (например, о выдаче кредитов) принимались на основе данных, предоставляемых клиентом. Но со временем стало ясно, что более объективными являются данные, которые формируются в результате его поведения: как он тратит деньги, его активность в интернете и т.д. Например, клиент скажет: «Я Лев Толстой», но при этом будет очень неграмотно писать. Машина очень быстро сделает заключение, что этот клиент – точно не Лев Толстой. Но при таком подходе количество информации о клиенте вырастает в разы. Здесь возникает вопрос: а можно ли все эти данные обрабатывать иначе, получать из них максимум полезной информации?

И здесь как раз встает вопрос о разграничении методов работы с Big Data.

Эксперт перечислил основные:

1. Машинное обучение. Начиная с конца 19 века этот тип обучения уже применялся в разных областях. У классического машинного обучения есть существенное ограничение: машина ответит только на тот вопрос, который вы ей задали.

2. Искусственный интеллект и нейронные сети. В сети направляется набор исходных данных в виде последовательностей, которые затем попадают в кодировщик (сжимаются посредством определенного кода). Затем данные восстанавливаются в исходном виде, и результат сжатия представляет огромный интерес: нейронная сеть способна найти определенные признаки самостоятельно – те, которые еще не смог увидеть человек.

Этот метод имеет ряд важных ограничений.

  • Он работает только там, где есть внутренняя структура данных (например, обучение языкам, логические последовательности и пр.). Если структуры данных нет, то метод не будет работать – нужно использовать классическое машинное обучение.

  • Исходных данных должно быть очень и очень много. Одно из преимуществ Сбербанка – огромные массивы данных по клиентам, в том числе по количеству лет на рынке, чего него у других банков.

  • Исходные данные должны быть разнообразны и подробны (нужно большое количество подробностей).

– Метод глубинного обучения нейронных сетей – очень мощный инструмент, он во многом превосходит человека и способен произвести революцию: в области здоровья, в финансовой сфере и многих других, – неоднократно подчеркивал Савченко. – Сегодня в Сбербанке как раз запускается пилотный проект по нейронным сетям.

В завершение лекции эксперт призвал заинтересованных партнеров к сотрудничеству:

– Нам необходим портфель инициатив. Квалифицированный инвестор всегда вкладывается в разные задачи. Поэтому лаборатория Сбербанка по искусственному интеллекту старается взять несколько крупных задач. И мы ищем инициативы.