Исследование показало, что строительные роботы учатся умнее и быстрее с помощью виртуальной реальности и имитации

Наш подход обучает роботов не просто подражать работникам-людям, но и совершенствоваться по сравнению с ними, изучая окружающую среду, говорит один из соавторов, профессор Т. Й. Ян. Это позволяет достигать баланса между человеческим опытом и оптимизацией на уровне машины.
Вместо использования контроллеров эксперты демонстрируют задачи с помощью естественных жестов рук, зафиксированных в VR, которые напрямую преобразуются в роботизированные команды.
Роботы обучаются на примерах экспертов, это внутреннее вознаграждение, и одновременно получают обратную связь от окружающей среды, это внешнее вознаграждение, что в совокупности ускоряет подготовку.
В отличие от традиционного обучения с подкреплением, для которого требуются сложные функции вознаграждения, этот метод использует простую, разреженную систему вознаграждения, которая стала возможной благодаря предварительной подготовке с подкреплением.
Используя широко распространенный шестисуставный робот xArm, команда смоделировала задачу установки окна. Примененный подход превзошел самые современные методы обучения по качеству выполнения задач и стабильности. Потребовалось меньше демонстраций, и была продемонстрирована надежность даже при работе с небольшими наборами данных.
Достигнут показатель успешности 97 процентов при выполнении операций по подъему и перемещению грузов в условиях реальных ограничений. Обеспечена возможность работы без столкновений за счет сглаживания траектории и обратной кинематики.
Этот гибридный подход значительно повышает эффективность обучения и применимость результатов в реальной жизни, говорит ведущий автор Канкан Дуань. Это отражает смену парадигмы в том, как мы обучаем машины для работы в динамичных строительных условиях.