DeepDigest
雷峰网 (Leiphone) · · ~2 мин

Legato от Chihiro Intelligent Goyang: плавные движения робота для RSS 2026

Команда Chihiro Intelligent Goyang разработала метод Legato для плавных движений роботов. Метод позволяет модели естественным образом генерировать непрерывные действия в процессе обучения, решая проблему резких переходов между последовательностями действий. Эксперименты с двуруким роботом показали сокращение времени выполнения задач и улучшение плавности движений.

Legato от Chihiro Intelligent Goyang: плавные движения робота для RSS 2026

Команда Chihiro Intelligent Goyang представила метод Legato, который позволяет сделать движения робота плавными и естественными — наподобие музыкального легато, где ноты плавно переходят одна в другую. Метод был отобран для участия в конференции RSS 2026 («Робототехника: наука и системы»).

Проблема резких переходов и колебаний при выполнении действий давно волнует разработчиков роботов. В современных моделях Vision Language Action (VLA) применяется техника «группирования действий»: робот заранее планирует последовательность действий на определённый период (например, на 1 секунду) и выполняет их по очереди. Но на стыке последовательностей часто возникают разрывы — робот может остановиться, встряхнуться или даже изменить направление движения.

Для решения этой проблемы ранее использовали метод разбивки на блоки в реальном времени (RTC): при создании новой последовательности действий «позаимствовали» невыполненную часть предыдущей, чтобы обеспечить плавный переход. Однако у этого подхода есть недостатки — например, модель не всегда корректно использует информацию о префиксах во время рассуждения.

Legato решает проблему иначе: вместо «исправления» модели во время рассуждения он позволяет ей научиться генерировать непрерывные действия естественным образом в процессе обучения. Метод включает четыре механизма:

  1. Смешивание шумов с истинным значением: модель тренируется начинать не с чистого шума, а со «смеси» шума и реального действия, что позволяет ей учиться продолжать уже начатые действия.
  2. Пошаговое управляемое шумоподавление: перед каждым этапом устранения шума модель получает напоминание о префиксе, что помогает сохранить согласованность действий.
  3. Согласование целей обучения и логического вывода: цель обучения корректируется так, чтобы полностью соответствовать пошаговой динамике управляемого рассуждения.
  4. Рандомизированные смешанные параметры: во время обучения модель сталкивается с разными комбинациями параметров задержки вывода (d) и длины переходной зоны (r), благодаря чему может адаптироваться к различным аппаратным платформам и требованиям к быстродействию без переподготовки.

Исследователи провели эксперименты с двуруким роботом, охватывающие пять задач: составление мисок, разливание продуктов, сбор и расстановка, укладка полотенец и выдвижение ящиков. Результаты показали, что Legato сокращает паузы и «передумывания» робота, уменьшает колебания, сокращает время выполнения задач в среднем на 10 % (в некоторых случаях — более чем на 20 %), а плавность траектории движения улучшается в среднем на 10 % (в отдельных задачах — более чем на 40 %).

Подробнее с исследованием можно ознакомиться в статье «Изучение нативного продолжения для разработки политики разделения потоков действий» (https://arxiv.org/pdf/2602.12978), а также на странице проекта: https://lyfeng001.github.io/Legato/.

// оригинал
雷峰网 (Leiphone) ↗ Читать оригинал
1 просмотров
// поделиться Telegram VK