Группа, специализирующаяся на робототехнике в подразделении DeepMind компании Google, представила три инновационных продукта, направленных на повышение скорости принятия решений, эффективности и безопасности действий роботов при выполнении задач в присутствии людей.
Об этом пишет РБК-Украина (проект Styler) со ссылкой на американский веб-сайт о компьютерной технике и гаджетах The Verge.
AutoRT, система сбора данных, функционирует на базе визуальной языковой модели (VLM) и большой языковой модели (LLM), которые обеспечивают роботам способность оценивать окружающую среду, адаптироваться к новым условиям и принимать решения по поставленным задачам. VLM применяется для анализа окружения и распознавания объектов в зоне видимости, тогда как LLM отвечает за творческое решение задач.
Важнейшим новшеством AutoRT стало появление в блоке LLM "Конституции роботов" - направленных на безопасность команд, предписывающих машине избегать выбора задач, в которых принимают участие люди, животные, острые предметы и даже электроприборы.
В целях дополнительной безопасности роботы программируются на остановку, когда усилие на суставах превышает определенный порог; а в их конструкции теперь имеется дополнительный физический выключатель, которым человек может воспользоваться в экстренном случае.
Авторы "Конституции робота" были вдохновлены Тремя законами робототехники Айзека Азимова:
Вторым инновационным улучшением стала система SARA-RT (Self-Adaptive Robust Attention for Robotics Transformers), ориентированная на оптимизацию работы модели RT-2. Исследователи обнаружили, что при удвоении объема входных данных, например, при повышении разрешения камер, потребность в роботе в вычислительных ресурсах увеличивается вчетверо.
Эту проблему удалось преодолеть с использованием нового метода тонкой настройки искусственного интеллекта, названного up-training. Он эффективно превращает квадратичный рост потребности в вычислительных ресурсах в почти линейный, позволяя модели работать более эффективно, сохраняя при этом высокое качество.
Наконец инженеры Google DeepMind представили искусственный интеллект RT-Trajectory, упрощающий обучение роботов выполнению конкретных задач. При постановке задания оператор демонстрирует образец выполнения; RT-Trajectory анализирует предоставленную человеком траекторию движения и адаптирует его к действиям робота.
Напомним, что представлен карманный робот-тамагочи с ИИ.
Читайте также о том, как робота-собаку Spot научили говорить.