Смена парадигмы в обучении ИИ: почему a16z инвестирует 43 млн долларов в Deeptune
Фонд a16z возглавил раунд финансирования стартапа Deeptune. Индустрия переходит от статических наборов данных к динамическим средам обучения с подкреплением для создания автономных агентов.

Фонд Andreessen Horowitz (a16z) возглавил раунд финансирования Серии А на сумму 43 миллиона долларов для стартапа Deeptune. На первый взгляд, это очередная инвестиция в инфраструктуру искусственного интеллекта. Однако за этой сделкой стоит фундаментальный сдвиг в том, как будут обучаться модели следующего поколения.
Долгое время прогресс в области ИИ определялся масштабированием: разработчики использовали больше вычислительных мощностей, улучшали архитектуры и, главное, собирали огромные массивы статических данных. Но по мере того как модели переходят от простой генерации текста к взаимодействию с реальным миром — использованию программ, навигации по интерфейсам и написанию кода — статических текстов из интернета становится недостаточно.

Your Data Agents Need Context
Главным ограничением становятся среды, в которых модели могут учиться, практиковаться и оцениваться. Обучение с подкреплением (reinforcement learning, или RL) превращается в критически важный слой стека технологий ИИ. Индустрия переходит от использования данных, размеченных людьми, к сложным инженерным системам, которые генерируют высококачественные сигналы для обучения в автоматическом режиме.
Стартап Deeptune, основанный Тимом Лупо, решает именно эту задачу. Компания создает передовые среды обучения с подкреплением, ориентированные на использование компьютера и написание кода. Чтобы модели могли выполнять сложные задачи, им требуются структурированные, реалистичные и измеримые условия. Создание таких сред — сложная инженерная задача, требующая глубокого понимания как передовых исследований, так и практических нужд ведущих лабораторий.




