Гуманоидные роботы стремительно сокращают разрыв между лабораторными демонстрациями и реальной полезностью. Недавние прорывы показывают, что эти машины осваивают бытовые задачи — от открывания дверей до намазывания арахисового масла — быстрее, чем предсказывали эксперты. Ключевым фактором является использование систем компьютерного зрения, которые превосходят традиционные методы, основанные на тактильной обратной связи.
Неожиданное Ускорение
Робототехник Бенджи Холсон разработал серию испытаний, получивших название «Гуманоидные Олимпийские Игры», чтобы проверить пределы современных роботов. Он ожидал, что эти задачи, начиная от простых действий, таких как открывание дверей, и заканчивая более сложными, например, застегиванием рубашек, займут годы для решения. Однако в течение нескольких месяцев компания Physical Intelligence завершила 11 из 15 испытаний, продемонстрировав возможности, которые ранее считались недостижимыми.
Эта скорость во многом обусловлена удивительной эффективностью систем, использующих только зрение. Исследователи обнаружили, что роботы могут выполнять задачи, требующие ощущения силы — например, вставку ключей или намазывание арахисового масла — просто путем анализа видеодемонстраций. Роботы учатся, многократно просматривая видео, совершенствуя свои движения без явного пошагового программирования.
Роль Искусственного Интеллекта и Обучения на Примерах
Быстрый прогресс обусловлен не только более качественными камерами, но и достижениями в области искусственного интеллекта, особенно применением архитектур трансформеров — той же технологии, которая лежит в основе больших языковых моделей (LLM).
«Мы начали использовать модели «зрение-действие», основанные на той же архитектуре трансформеров, что и LLM. Вы можете использовать трансформеры для преобразования текста в текст, изображений в текст, но также и изображений в действия робота». — Бенджи Холсон
Эти модели используют предварительно обученный искусственный интеллект, который уже понимает базовые концепции — что такое чайник, что такое вода — позволяя роботу сосредоточиться на конкретной задаче, а не на фундаментальном распознавании объектов.
Пределы Тактильной Обратной Связи и Расцвет Систем, Основанных на Зрении
Традиционная робототехника сильно зависела от тактильной обратной связи, но современные технологии касания дороги, хрупки и отстают от достижений в области зрения. Исследователи обнаружили, что камеры, особенно те, которые расположены близко к пальцам робота, могут определять силу, наблюдая за тем, как объекты деформируются под давлением. Это позволяет роботам «видеть» силу, а не «чувствовать» ее, достигая удивительных результатов.
Вопросы Безопасности и Дальнейший Путь
Скорость и мощность, необходимые гуманоидным роботам для поддержания равновесия, создают риски для безопасности. Падающий робот может быстро набрать скорость, что может привести к травмам. В то время как некоторые исследователи выступают за более безопасные конструкции, такие как кентавроподобные роботы с колесной базой, отрасль, похоже, склоняется к приоритету функциональности, а затем к решению проблем безопасности.
«Общий план, похоже, заключается в создании робота, настолько ценного, что мы, как общество, создадим для него новый класс безопасности — как велосипеды и автомобили. Они опасны, но настолько полезны, что мы терпим риск». — Бенджи Холсон
Сроки Появления Домашних Роботов
Первоначально эксперты предсказывали, что домашние роботы появятся не раньше, чем через 15 лет. Однако недавние достижения позволяют предположить, что функциональные, хотя и не обязательно коммерчески жизнеспособные, домашние роботы могут появиться в течение шести лет. Самым большим препятствием остается надежность; сокращение разрыва между лабораторными демонстрациями и серийными продуктами займет время. Несмотря на это, темпы прогресса неоспоримы, и эра по-настоящему полезных гуманоидных роботов может быть ближе, чем когда-либо предполагалось.




















