Про AI агентов, ч.1
Самый хайповый термин сегодня! Очень много определений, полезно разобраться. Вот как понимаю его я, на основе изучения вопроса с точки зрения фаундера:
Если работа с LLM для хорошего результата предполагает очень точное формулирование задачи и промптинг, то AI агент может сам написать “техзадание”, валидируя его с человеком и реальным миром. А затем запустить процесс, периодически так же валидируя его этапы.
Это в целом похоже на работу реального агента, например страхового, туристического или агента недвижимости: он задает нужные вопросы, имеет контекст из реального мира и в итоге предлагает конечные варианты для выбора клиентом.
Еще разницу между автоматизацией, AI воркфлоу и AI агентом можно понять из картинки (источник). Эту разницу в целом можно назвать "софт vs llm vs агенты".

1️⃣ Звучит красиво! Однако лично я считаю, что нас ждет огромное разочарование, а многие стартапы уже через год будут все реже использовать термин “AI agent”, потому что в массовом сознании он будет ассоциироваться с ”идея прикольная, подождем, когда будет нормально работать”. Как сейчас уже перестали к любому названию приписывать AI.
2️⃣ Главная проблема концепта AI агентов - это фундаментальные сложности LLM с reliability. Могут быть ошибки, которые за один раз сводят на нет все выгоды использования агента. И наверняка можно уйти в минус!
3️⃣ Недавний ChatGPT Operator должен донести до нас, как работает сегодняшний золотой стандарт AI агента. Уровень пока не супер - он проще определения из этого поста. Работает так себе: вряд ли массовый пользователь будет готов мириться с тем уровнем глупых ошибок, которые допускает operator.
Например бронирование столика в кафе человек может сделать за пару минут. Если посчитать все время и усилия на работу AI агента + промптинг + вовлечение в контекст процесса для промежуточных решений, то становится понятно, что ни сегодняшние агенты, ни решения ближайших лет не будут соответствовать определению AI агентов из этого поста.
Но есть много задач, где operator хорош уже сегодня.
4️⃣Похожее с автопилотом в машинах, который на деле является улучшенным круиз-контролем. Мы ждем обещанные массовые автопилоты уже лет 15, но пока self-driving taxi есть в городах, которые славятся громким маркетингом - СФ, Абу Даби, Сингапур, китайские мегаполисы и др. Экономической эффективностью там конечно не пахнет, но охваты большие.
Operator для OpenIAI тоже скорее маркетинговый ход: им не будут пользоваться много, но волну упоминаний в медиа получат. Это нормально для компаний, которые сильно зависят от охватов.
5️⃣ Разного рода копайлоты будут развиваться. Их можно по-разному красиво называть, чтобы вызвать интерес пользователей и инвесторов. Но по сути это просто новое поколение очень полезных подручных инструментов - как принтер, калькулятор, фотошоп. Не претендующих на сложное ”обдумывание”, а просто делающих самую тупую рутинные работу.
6️⃣ Верю, что в ближайшие пару лет мы начнем совсем по-другому искать информацию в интернете. Полагаю, что никто кроме Гугла не сможет массово повлиять на привычки - он придет и выжжет поле широкого AI поиска, оставив остальным специфический вроде legal research.
В AI всегда выигрывают большие игроки - так было с компьютерным зрением, распознаванием голоса и др. Поэтому в большом поиске я бы поставил на продолжение гегемонии Гугла, уже есть deep research (правда пока работает не очень).
Perplexity уйдет из числа заметных игроков: они кстати налево и направо раздают бесплатный доступ к pro, чтобы удержать количество “платных” пользователей. Уверен, что их ретеншн не впечатляет инвесторов. И недавно приделали поиск по БД crunchbase - кажется они идут в ”ресерч для фаундеров и виси”, что говорит о многом.
7️⃣ Ну и классика: далеко не все, заявляющие об AI агентах у себя в продуктах, делают AI агентов. Даже в таком несложном понимании, как я описал выше.
При этом нередко агента определяют как нечто намного более сложное: он может сам принимать решения, учиться и делегировать.
Ну такое мы ждем вместе с AGI 🙂