Исследователи из Корнеллского университета разработали новую роботизированную систему на основе искусственного интеллекта под названием RHyME (Retrieval for Hybrid Imitation under Mismatched Execution), которая позволяет роботам обучаться выполнению задач, просматривая одно обучающее видео. Роботы могут быть привередливыми в обучении. Исторически сложилось так, что для выполнения базовых задач им требовались чёткие пошаговые инструкции, и они, как правило, сдавались, когда что-то шло не по плану, например, когда они роняли инструмент или теряли винт. Однако RHyME может ускорить разработку и внедрение роботизированных систем, значительно сократив время, энергию и деньги, необходимые для их обучения, заявили исследователи.
Одна из неприятных особенностей работы с роботами — сбор большого количества данных о том, как робот выполняет различные задачи. Люди выполняют задачи не так. Мы смотрим на других людей как на источник вдохновения.
Кушал Кедия, аспирант в области компьютерных наук
В мае Кедия представит доклад под названием "Одноразовая имитация при несоответствующем выполнении" на Международной конференции Института инженеров по электротехнике и электронике по робототехнике и автоматизации в Атланте. Работа также доступна на сервере препринтов arXiv.
До домашних роботов-помощников ещё далеко, потому что им не хватает сообразительности, чтобы ориентироваться в физическом мире и его бесчисленных непредвиденных обстоятельствах. Чтобы ускорить развитие роботов, исследователи, такие как Кедия, обучают их с помощью видеороликов, демонстрирующих выполнение различных задач в лабораторных условиях. Этот подход, разновидность машинного обучения под названием "имитационное обучение", позволяет надеяться, что роботы будут быстрее осваивать последовательность задач и смогут адаптироваться к реальным условиям.
Наша работа похожа на перевод с французского на английский — мы переводим любую задачу с человеческого языка на язык роботов.
старший автор Санджибан Чоудхури, доцент кафедры компьютерных наук
Однако перед этой задачей перевода по-прежнему стоит более масштабная проблема: люди двигаются слишком плавно, чтобы робот мог отслеживать и имитировать их движения, а для обучения роботов с помощью видео требуется огромное количество видеоматериалов. Кроме того, видеодемонстрации, например, того, как взять салфетку или поставить стопку тарелок, должны выполняться медленно и безупречно, поскольку любое несоответствие в действиях между видео и роботом исторически приводило к провалу обучения роботов, говорят исследователи.
Если человек двигается не так, как робот, метод сразу же перестаёт работать. Мы думали: "Можем ли мы найти принципиальный способ справиться с этим несоответствием между тем, как люди и роботы выполняют задачи?"
старший автор Санджибан Чоудхури
Напомним, что RHyME — это ответ команды на вопрос о масштабируемом подходе, который делает роботов менее привередливыми и более адаптивными. Он позволяет роботизированной системе использовать собственную память и находить связи при выполнении задач, которые она видела только один раз, опираясь на просмотренные видео. Например, робот, оснащённый RHyME, увидев видео, на котором человек берёт кружку со стола и ставит её в раковину, просмотрит свой архив видео и вдохновится похожими действиями — например, возьмёт чашку и опустит ложку. По словам исследователей, RHyME позволяет роботам изучать многоэтапные последовательности действий, значительно сокращая при этом объём данных, необходимых для обучения. RHyME требует всего 30 минут данных о действиях робота; по словам исследователей, в лабораторных условиях роботы, обученные с помощью этой системы, более чем на 50 процентов чаще выполняли задачи по сравнению с предыдущими методами.
Эта работа отличается от того, как программируют роботов сегодня. При нынешнем подходе к программированию роботов требуются тысячи часов удалённого управления, чтобы научить робота выполнять задачи. Это просто невозможно. С RHyME мы уходим от этого и учимся обучать роботов более масштабируемым способом.
старший автор Санджибан Чоудхури
Простой социальный жест может повысить вероятность того, что люди будут проверять факты в интернете.
Фото и видео: Cornell University
Обсуждение ( 0 ) Посмотреть все