Компании разработали ИИ-систему управления роботами для взаимодействия с физическим миром. Она может применяться в различных сферах — от логистики до проведения спасательных операций. Испытания показали, что в реальных условиях система может работать с точностью до 95%. Исследовательский проект не имеет аналогов в России.
Москва, 7 декабря 2020 года. — Сбер и исследовательское подразделение Microsoft Research подвели итоги совместного проекта, анонсированного в октябре 2019 года. Разработанная уникальная ИИ-система дает возможность обучить роботов манипулировать физическими объектами непостоянной формы практически так, как это делает человек. Ключевой целью исследовательского проекта была разработка решения, способного взаимодействовать с людьми, освобождая их от механически сложной рутинной работы и обеспечивая высокий уровень безопасности. Кроме того, это один из первых примеров переноса подобной технологии из симуляции в реальный мир — обученная система была внедрена и протестирована в Лаборатории робототехники Сбера.
Видео с демонстрацией функционала робота доступно здесь.
«Совместно с Microsoft нам удалось добиться результатов, очень важных для развития искусственного интеллекта и робототехники. Система может быть востребована во множестве отраслей отечественной экономики. Мы намерены продолжать исследования, чтобы способствовать развитию цифровых технологий и обеспечивать российские компании современными высокопроизводительными роботами», — отметил заместитель Председателя Правления Сбербанка Станислав Кузнецов.
Работа над проектом осуществлялась в Лаборатории робототехники Сбера в Москве, Россия, и в Microsoft в Беркли и Редмонде, США, и в совокупности длилась больше года, с мая 2019 года по май 2020. Исследовательская группа состояла из 8 человек. Их практической задачей было разработать технологию выгрузки с помощью робота-манипулятора инкассаторских мешков с монетами весом до 6 килограмм из мобильных тележек для их последующей обработки в счетных машинах. В отличие от захвата твердотельных объектов, манипуляции объектами непостоянной формы из-за подвижного центра тяжести требуют постоянного вычисления положения и ориентации захватного устройства в каждом отдельном случае. Для расчета и предсказания этих параметров были применены методы глубокого обучения[1] и обучения с подкреплением[2]. Испытания продемонстрировали успешность выгрузки мешков с первого раза в более 95% в реальных условиях.
Процесс работы над проектом проходил в три этапа. Первый — разработка реалистичной симуляции робототехнической установки и объектов манипуляции — деформируемых мешков с монетами с учетом их физических характеристик. Вторым этапом была интеграция симуляторов с фреймворком машинного обучения с подкреплением и проведение экспериментов в симуляционной среде с обучением интеллектуального агента управлению виртуальным роботом. Для этого исследователями был применен подход machine teaching (англ. «обучение машин»). Методика предполагает не только обучение посредством взаимодействия алгоритма со средой, как в классическом обучении с подкреплением, но и использование «подсказок» от человека. На этом этапе необходимо было прописать правильные опорные точки для алгоритма, на основе которых он сможет обучаться. Это позволяет значительно ускорить процесс и сделать его более эффективным. На завершающем третьем этапе обученного в симуляторах интеллектуального агента перенесли непосредственно на физического робота. В результате в Лаборатории робототехники Сбера были успешно протестированы реальные манипуляции по разгрузке тележки с мешками монет роботом.
Создатели системы уверены, что подобная технология может быть востребована в широком ряде сфер. Особенно целесообразно ее применение для решения тех задач, где человек подвергается опасности или должен прилагать чрезвычайные физические усилия, например, в спасательных операциях, нефтедобыче, логистике и т.д. — везде, где необходимо совершать действия с объектами непостоянной формы.
«Мы высоко оцениваем результаты совместного исследовательского проекта и рады продолжать сотрудничество со Сбером в этом и других направлениях, — прокомментировала Кристина Тихонова, президент Microsoft в России. — Уровень доверия, сложившийся между нашими компаниями, позволяет внести существенный вклад в развитие прикладного ИИ в России и во всем мире, а также способствовать цифровой трансформации бизнеса и экономики в нашей стране».
Компании продолжат сотрудничество в исследовательской сфере, чтобы способствовать развитию и более широкому распространению своих разработок на стыке робототехники и искусственного интеллекта.
[1] Глубокое обучение (глубинное обучение; англ. deep learning) — разновидность машинного обучения, позволяющая вычислительным системам познавать предметную область, представляя ее в виде постепенно формируемой в процессе обучения (опыта) иерархии концепций — от простых к сложным. При этом от разработчика не требуется заранее задавать эти концепции. Многие современные системы глубокого обучения реализованы как многослойные (глубокие) искусственные нейронные сети, в которых разные слои отвечают разным уровням абстракции. [2] Обучение с подкреплением (англ. reinforcement learning) — один из способов машинного обучения, в ходе которого целевая система (агент) обучается, взаимодействуя с некоторой средой, выступающей в роли «учителя». Такая среда может быть как естественной, так и виртуальной.