Алгоритм WHIRL помогает обучать роботов имитации человеческих действий для домашней работы

Любопытный эксперимент воплощают в жизнь специалисты Института робототехники Школы компьютерных наук Университета Карнеги-Меллона в Питтсбурге (США). Ими был разработан эффективный алгоритм визуальной имитации, получивший обозначение WHIRL (Wild Human Imitating Robot Learning), позволяющий обучать роботов на основе наблюдения за действиями человека, и обобщать полученную информацию для выполнения новых задач.

К настоящему времени с помощью алгоритма WHIRL роботы уже научились выполнять более двух десятков задач: от открывания и закрывания дверей шкафов, ящиков до складывания одежды и даже извлечения мешка для мусора из мусорного ведра.

От эксперимента до повседневного применения

Один из разработчиков WHIRL, доктор Шихар Бал рассказывает, как проходил процесс обучения.

Робот наблюдал, как его человек-наставник открывал дверцу холодильника. Алгоритм фиксировал все движения, которые были сделаны, местонахождение холодильника, угол открытия двери, а также некоторые другие данные, прежде, чем робот предпринял попытку повторить то, что сделал Шихар Бал. В нескольких случаях он захватывал ручку холодильника в неправильном месте, дёргал её с недостаточной силой или же просто пропускал её. Чтобы выполнить действие безукоризненно, роботу потребовалось несколько часов практики. Но, в конце концов, он справился с задачей!

«Имитация – отличный способ обучения», – прокомментировал Бал. «Прежде нерешённой проблемой в этой области оставалось отсутствие необходимого программного обеспечения, позволяющего роботу приобретать новые знания посредством наблюдения. Теперь мы сделали значительный шаг вперёд».

Практическая сфера применения алгоритма WHIRL очевидна. Люди постоянно выполняют различные задачи, ухаживая за своими жилищами. Часть из них могла бы быть переложена на роботов, при этом WHIRL не требует, чтобы необходимые действия были запрограммированы в машину заранее. 

Шихар Бал и его коллеги также предусмотрели возможность обучения роботов различным действиям не только посредством демонстрации на личном примере, но и с помощью наблюдения роботом за записанным видеоуроком. Результаты оказались идентичными: каждый раз робот какое-то время наблюдал, затем практиковался, после чего мог выполнить задание самостоятельно.

Разумеется, на данном этапе исследования речь идёт преимущественно о несложных задачах. Какое-то время требуется роботу и на совершенствование приобретённых навыков. Между тем, если посредством WHIRL роботов удастся научить более сложным действиям, а время практики сократится, возможности применения алгоритма в быту станут несоизмеримо шире.

Презентация прошла успешно

На днях команда разработчиков WHIRL представила своё исследование на конференции Robotics: Science and Systems в Нью-Йорке.  

«Вместо того, чтобы ждать, пока роботы будут запрограммированы или обучены для успешного выполнения различных задач, прежде чем размещать их в домах людей, эта технология позволяет нам адаптировать роботов к окружающей среде непосредственно в процессе обучения», – сказал на конференции доктор Шихар Бал.

Современные методы обучения робота задаче обычно основаны на имитации или же на так называемом обучении с подкреплением . При имитационном обучении люди вручную управляют роботом, чтобы научить его выполнять тут или иную задачу. При обучении с подкреплением действие многократно моделируется, после чего адаптируется к реальному миру.

Обе этих модели могут быть успешны при обучении робота одной задаче в структурированной среде, где все элементы пространства строго привязаны к определённым местам. Но они, как правило, оказываются малоэффективными при масштабировании задач в реальных условиях.

Алгоритм WHIRL легко подстраивает робота под необходимый масштаб действия и не ограничивается одной конкретной задачей. Свою работоспособность подтвердила даже версия WHIRL, адаптированная для взаимодействия робота с YouTube. Проще говоря, робот может смотреть обучающее видео в сети и точно так же практиковаться в полученных навыках. Стоит добавить, что разработка WHIRL стала возможной благодаря развитию систем компьютерного зрения. Компьютеры теперь способны понимать чужие движения и самостоятельно моделировать их в 3D, что открывает перед ним ранее недосягаемые перспективы.

Источник

Total
0
Shares
Добавить комментарий
Похожие статьи

Профессиональная спортивная лига Karate Combat запускает DAO для болельщиков и спортсменов

Karate Combat, известная, как первая профессиональная лига полноконтактного карате, объявила о решении создать децентрализованную автономную организацию (DAO), чтобы…
Подробнее

Онлайн-магазины смогут брать авансы до 10 миллионов евро

Благодаря новому партнёрству с финтех-кредитором Uncapped, инновационный поставщик платёжных услуг, компания PingPong Payments, предложит онлайн-продавцам авансовые платежи на…
Подробнее
Сброс пароля
Новый пароль