RynnBrain от Alibaba побил 16 рекордов в области робототехники, обогнав модели искусственного интеллекта от Google и NVIDIA
Alibaba включилась в гонку за создание «физического искусственного интеллекта» с помощью новой модели, предназначенной для управления роботами в реальном мире.
Во вторник китайский технологический гигант представил RynnBrain - систему искусственного интеллекта, которая помогает машинам понимать пространство, объекты и движение.
Этот запуск свидетельствует о растущем интересе Alibaba к робототехнике - сфере, которая уже привлекает крупные инвестиции таких американских компаний, как NVIDIA и Google.
В коротком демонстрационном видео, опубликованном DAMO Academy от Alibaba, показано, как робот распознает фрукты и складывает их в корзину. Задача кажется простой.
Но на самом деле это не так. Робот должен распознавать объекты, отслеживать их положение и планировать точные движения в режиме реального времени.
Alibaba позиционирует RynnBrain как базовую модель «воплощенного ИИ». В эту категорию входят роботы, беспилотные транспортные средства и другие машины, которые напрямую взаимодействуют с физической средой.
Китай сделал физический искусственный интеллект национальным приоритетом на фоне обострения конкуренции с Соединенными Штатами.
• Создан для работы с памятью в реальном мире
RynnBrain нацелен на устранение главного недостатка существующих моделей робототехники: плохой пространственно-временной памяти.
Традиционные системы искусственного интеллекта часто забывают расположение объектов или неправильно интерпретируют сцены. В Alibaba утверждают, что RynnBrain решает обе эти проблемы с помощью пространственно-временной памяти.
Эта функция позволяет роботам запоминать, где находились объекты ранее, и прогнозировать их дальнейшее движение.
Система также поддерживает глобальную ретроспективу. Робот может проанализировать свои предыдущие действия, прежде чем сделать следующий шаг. Такой подход помогает сократить количество ошибок при выполнении сложных задач.
Рассуждения в физическом пространстве - это еще один уровень. RynnBrain сочетает текстовую логику с пространственными подсказками. Этот гибридный метод позволяет роботам принимать решения, которые лучше отражают реальное окружение.
Alibaba обучила модель на своей системе визуального языка Qwen3-VL. DAMO Academy оптимизировала ее с помощью специальной архитектуры под названием RynnScale.
По словам представителей компании, эта настройка позволила удвоить скорость обучения без увеличения вычислительных ресурсов.
• Модель меньшего размера, роботы быстрее
В рамках основного релиза была представлена первая в отрасли модель искусственного интеллекта на основе смеси экспертов с 30 миллиардами параметров.
Несмотря на свой размер, система активирует только 3 миллиарда параметров во время логического вывода. Alibaba утверждает, что такая эффективность позволяет модели превосходить гораздо более крупные системы с 72 миллиардами параметров.
Снижение требований к логическому выводу приводит к более плавным движениям робота и более быстрому принятию решений.
Эти преимущества важны для практического применения, где производительность часто ограничивается энергопотреблением и задержками.
Тесты на производительность показывают хорошие результаты.
По данным Alibaba, RynnBrain установил новые рекорды в 16 тестах на воплощенный искусственный интеллект с открытым исходным кодом. Эти тесты измеряли восприятие окружающей среды, пространственное мышление и выполнение задач.
По словам представителей компании, RynnBrain превзошел конкурирующие системы, такие как Gemini Robotics ER 1.5 от Google и Cosmos Reason 2 от NVIDIA.
Помимо RynnBrain, DAMO Academy выпустила семь моделей с полностью открытым исходным кодом. Среди них базовые модели и доработанные версии, предназначенные для коммерческого использования.
Alibaba заявляет, что эти релизы призваны снизить исследовательские барьеры для разработчиков робототехники.
Открытый доступ может ускорить внедрение робототехники в производстве, логистике и сфере услуг.
DAMO Academy также представила новую систему оценки под названием RynnBrain-Bench.
Эта система призвана устранить давний пробел в тестировании воплощенного искусственного интеллекта.
Она ориентирована на решение сложных пространственно-временных задач, а не на распознавание статичных изображений.
Благодаря этому шагу Alibaba выходит на новый уровень глобальной конкуренции, в которой участвуют технологические лидеры и стартапы из США.