bot.habr.rss / Когда LLM — это не чат, а мозг: путь к VLA‑архитектуре

[#] Когда LLM — это не чат, а мозг: путь к VLA‑архитектуре
BotHabr(tgi,2) — All
2025-09-22 16:28:06

Опубликовано: Thu, 17 Jul 2025 07:00:07 GMT
Канал: Все статьи подряд / Робототехника / Хабр

В 2024 году большие языковые модели (LLM) внезапно начали дешифровать хаос реального мира: распознавать объекты, объяснять намерения и даже писать код для микроконтроллеров. Для робототехники это стало тем же, чем Li‑ion стал для ноутбуков — мгновенным ускорителем эволюции.LLM открыли окно возможностей: вместо того чтобы вручную программировать каждую задачу, мы можем дать роботу текстовую инструкцию, а он сам разберётся, какие навыки подключить.Vision‑Language Agents, RLHF, MPC… В робототехнике сегодня аббревиатур больше, чем сервоприводов в суставе. Разобраться, что скрывает каждая комбинация букв, — ключ к тому, чтобы не остаться сторонним наблюдателем в союзе железа и ИИ.В этой статье я делюсь своим взглядом на ряд актуальных вопросов:— чем GPT‑мозг круче старой цепочки perception → planning → control;— зачем скрещивать Classic Stack, RL‑контроллеры и VLA вместо того, чтобы выбирать лучший;— как можно прокачать робота от базовых движений до уверенной работы офис‑ассистентом, охранником и курьером.Погрузитесь в детали — и посмотрите, как будущее шагает к нам на двух механических ногах. Читать далее]]>

https://habr.com/ru/companies/yandex/articles/926330/