Огромный скачок для мини-гепарда

Огромный скачок для мини-гепарда
Огромный скачок для мини-гепарда

Новая система управления, продемонстрированная на роботизированном мини-гепарде Массачусетского технологического института, позволяет четвероногим роботам прыгать по пересеченной местности в режиме реального времени.

Робот-гепард в Массачусетском технологическом институте
Робот-гепард в Массачусетском технологическом институте

Прыгающий гепард мчится по холмистой местности, перепрыгивая неожиданные пропасти в пересеченной местности. Движение может выглядеть легким, но заставить робота двигаться таким образом - совсем другая перспектива, сообщает MIT News.

В последние годы четвероногие роботы, вдохновленные движением гепардов и других животных, сделали большой скачок вперед, но они все еще отстают от своих собратьев-млекопитающих, когда дело доходит до путешествия по ландшафту с быстрым подъемом. изменения.

«В таких условиях вам нужно использовать зрение, чтобы избежать неудачи. Например, трудно избежать попадания в пропасть, если вы ее не видите. Несмотря на то, что существуют некоторые существующие методы включения зрения в передвижение на ногах, большинство из них на самом деле не подходят для использования с появляющимися гибкими робототехническими системами», - говорит Габриэль Марголис, аспирант лаборатории Пулкита Агравала, профессор компьютерных наук и Лаборатория искусственного интеллекта (CSAIL) Массачусетского технологического института.

Теперь Марголис и его сотрудники разработали систему, которая повышает скорость и ловкость роботов на ногах, когда они прыгают через пропасти на местности. Новая система управления разделена на две части: одна обрабатывает входные данные в режиме реального времени с видеокамеры, установленной на передней части робота, а другая преобразует эту информацию в инструкции о том, как робот должен двигать своим телом. Исследователи протестировали свою систему на мини-гепарде Массачусетского технологического института, мощном и подвижном роботе, созданном в лаборатории профессора машиностроения Сангбэ Кима.

В отличие от других методов управления четвероногим роботом, эта система, состоящая из двух частей, не требует предварительного картографирования местности, поэтому робот может двигаться куда угодно. В будущем это может позволить роботам убегать в лес для оказания экстренной помощи или подниматься по лестнице, чтобы доставлять лекарства пожилому затворнику.

Марголис написал статью вместе со старшим автором Пулкитом Агравалом, который возглавляет лабораторию невероятного ИИ в Массачусетском технологическом институте и является доцентом по развитию карьеры Стивена Г. и Рене Финн на кафедре электротехники и компьютерных наук; профессор Сангбэ Ким на факультете машиностроения Массачусетского технологического института; и сокурсники Тао Чен и Сян Фу из Массачусетского технологического института. Среди других соавторов Картик Пайгвар, аспирант Аризонского государственного университета; и Донхьюн Ким, доцент Массачусетского университета в Амхерсте. Работа будет представлена в следующем месяце на конференции по обучению роботов.

Все под контролем

Использование двух отдельных контроллеров, работающих вместе, делает эту систему особенно инновационной.

Контроллер - это алгоритм, который преобразует состояние робота в набор действий, которым он должен следовать. Многие слепые контроллеры - те, у которых нет зрения - надежны и эффективны, но позволяют роботам ходить только по сплошной местности.

Зрение - это такой сложный сенсорный ввод, который эти алгоритмы не могут эффективно обрабатывать. Системы, которые включают в себя зрение, обычно полагаются на «карту высот» местности, которая должна быть либо предварительно сконструирована, либо сгенерирована на лету, процесс, который обычно медленный и подвержен сбоям, если карта высот неверна.

Для разработки своей системы исследователи взяли лучшие элементы из этих надежных слепых контроллеров и объединили их с отдельным модулем, который управляет зрением в режиме реального времени.

Камера робота фиксирует глубинные изображения приближающейся местности, которые передаются на высокоуровневый контроллер вместе с информацией о состоянии тела робота (угол сочленений, ориентация тела и т. д.). Контроллер высокого уровня - это нейронная сеть, которая «учится» на собственном опыте.

Эта нейронная сеть выводит целевую траекторию, которую второй контроллер использует для получения крутящих моментов для каждого из 12 суставов робота. Этот низкоуровневый контроллер не является нейронной сетью, а опирается на набор кратких физических уравнений, описывающих движение робота.

«Иерархия, включая использование этого низкоуровневого контроллера, позволяет нам ограничивать поведение робота, чтобы он вел себя более корректно. С этим низкоуровневым контроллером мы используем четко определенные модели, на которые мы можем накладывать ограничения, что обычно невозможно в обучающей сети», - говорит Марголис.

Обучение сети

Исследователи использовали метод проб и ошибок, известный как обучение с подкреплением, для обучения контроллера высокого уровня. Они смоделировали робота, бегущего по сотням различных прерывистых ландшафтов, и вознаградили его за успешное пересечение.

Со временем алгоритм узнал, какие действия приносят максимальную награду.

Затем они построили физическую местность с зазорами из набора деревянных досок и проверили свою схему управления с помощью мини-гепарда.

«Было определенно весело работать с роботом, который был разработан в Массачусетском технологическом институте некоторыми из наших сотрудников. Мини-гепард - отличная платформа, потому что он модульный и сделан в основном из деталей, которые можно заказать в Интернете, поэтому, если нам нужна была новая батарея или камера, нам было просто заказать ее у обычного поставщика и, с небольшим небольшая помощь лаборатории Сангбэ в установке», - говорит Марголис.

В некоторых случаях оценка состояния робота оказывалась сложной задачей. В отличие от моделирования, датчики реального мира сталкиваются с шумом, который может накапливаться и влиять на результат. Поэтому для некоторых экспериментов, связанных с высокоточной постановкой ног, исследователи использовали систему захвата движения для измерения истинного положения робота.

Их система превзошла другие, которые используют только один контроллер, и мини-гепард успешно пересек 90 процентов местности.

«Одним из нововведений нашей системы является то, что она регулирует походку робота. Если бы человек пытался перепрыгнуть через действительно широкий проем, он мог бы начать с очень быстрого бега, чтобы набрать скорость, а затем поставить обе ноги вместе, чтобы совершить действительно мощный прыжок через пропасть. Точно так же наш робот может регулировать время и продолжительность контакта своих ног, чтобы лучше перемещаться по местности», - говорит Марголис.

Прыжок из лаборатории

Хотя исследователи смогли продемонстрировать, что их схема управления работает в лаборатории, им еще предстоит пройти долгий путь, прежде чем они смогут развернуть систему в реальном мире, говорит Марголис.

В будущем они надеются установить на робота более мощный компьютер, чтобы он мог выполнять все свои вычисления на борту. Они также хотят улучшить систему оценки состояния робота, чтобы исключить необходимость в системе захвата движения. Кроме того, они хотели бы улучшить низкоуровневый контроллер, чтобы он мог использовать весь диапазон движений робота, и улучшить высокоуровневый контроллер, чтобы он хорошо работал в различных условиях освещения.

«Примечательно наблюдать гибкость методов машинного обучения, способных обходить тщательно разработанные промежуточные процессы (например, оценку состояния и планирование траектории), на которые опирались многовековые методы, основанные на моделях», - говорит Ким.. «Я воодушевлен будущим мобильных роботов с более надежной обработкой зрения, специально обученных для передвижения».

Исследование частично поддерживается Лабораторией невероятного ИИ Массачусетского технологического института, Лабораторией биомиметической робототехники, NAVER LABS и Программой здравого смысла DARPA.

Публикуется с разрешения MIT News. Прочтите исходную статью.