Роботи-гуманоїди швидко скорочують розрив між лабораторними демонстраціями та корисністю в реальному світі. Нещодавні відкриття показують, що ці машини справляються з повсякденними завданнями — від відкривання дверей до розмазування арахісового масла — швидше, ніж прогнозували експерти. Ключовим є використання систем комп’ютерного зору, які перевершують традиційні методи, засновані на тактильному зворотному зв’язку.
Несподіване прискорення
Робототехнік Бенджі Холсон розробив серію тестів під назвою «Олімпіада гуманоїдів», щоб перевірити межі сучасних роботів. Він очікував, що на вирішення цих завдань, починаючи від простих завдань, таких як відкривання дверей, і закінчуючи більш складними, такими як застібання сорочок, знадобляться роки. Проте протягом кількох місяців Physical Intelligence завершила 11 із 15 тестів, продемонструвавши можливості, які раніше вважалися недосяжними.
Ця швидкість значною мірою пояснюється дивовижною ефективністю систем, які використовують лише зір. Дослідники виявили, що роботи можуть виконувати завдання, які вимагають відчуття сили, наприклад вставляти ключі чи розмазувати арахісове масло, просто аналізуючи відеодемонстрації. Роботи навчаються, переглядаючи відео неодноразово, вдосконалюючи свої рухи без явного покрокового програмування.
Роль штучного інтелекту та навчання на прикладі
Швидкий прогрес зумовлений не лише кращими камерами, а й прогресом у штучному інтелекті, особливо використанням архітектури Transformer — тієї самої технології, яка є основою для великих мовних моделей (LLM).
“Ми почали використовувати моделі бачення-дій, засновані на тій самій трансформаторній архітектурі, що й LLM. Ви можете використовувати трансформери для перетворення тексту в текст, зображень у текст, а також зображень у дії роботів”. – Бенджі Холсон
У цих моделях використовується попередньо навчений штучний інтелект, який уже розуміє основні поняття — що таке чайник, що таке вода — що дозволяє роботу зосередитися на конкретному завданні, а не на розпізнаванні основного об’єкта.
Обмеження тактильного зворотного зв’язку та розвиток систем на основі зору
Традиційна робототехніка значною мірою покладалася на тактильний зворотний зв’язок, але сучасні сенсорні технології є дорогими, крихкими та відстають від прогресу в області зору. Дослідники виявили, що камери, особливо ті, що розташовані поблизу пальців робота, можуть виявляти силу, спостерігаючи, як об’єкти деформуються під тиском. Це дозволяє роботам «бачити» силу, а не «відчувати» її, досягаючи неймовірних результатів.
Проблеми безпеки та шлях уперед
Швидкість і потужність, необхідні гуманоїдним роботам для збереження рівноваги, створюють ризики для безпеки. Падаючий робот може швидко набрати швидкість, що може спричинити травму. У той час як деякі дослідники виступають за більш безпечні конструкції, такі як роботи, схожі на кентаврів, з колесами, індустрія, схоже, схиляється до пріоритету функціональності перед вирішенням питань безпеки.
“Здається, загальний план полягає в тому, щоб створити настільки цінного робота, що ми, як суспільство, створимо для нього новий клас безпеки – як велосипеди та автомобілі. Вони небезпечні, але настільки корисні, що ми терпимо ризик”. – Бенджі Холсон
Час появи домашніх роботів
Спочатку експерти прогнозували, що домашні роботи не з’являться як мінімум через 15 років. Однак останні досягнення показують, що функціональні, хоча і не обов’язково комерційно життєздатні, домашні роботи можуть бути доступні протягом шести років. Найбільшою перешкодою залишається надійність; Усунення розриву між лабораторними демонстраціями та виробництвом продукції займе час. Незважаючи на це, темпи прогресу незаперечні, і ера справді корисних гуманоїдних роботів може бути ближчою, ніж будь-коли думали.






























































