В чём разница между полноценным ИИ Агентом и просто Ассистентом?

Оглавление

В чём разница между полноценным ИИ Агентом и просто Ассистентом?

В итоге всё сводится к тому, что Агент состоит из множества Ассистентов, которые взаимодействуют между собой, договариваются, выполняют задачи и так далее. Процесс состоит из шагов, и на каждом из них в той или иной степени задействован либо Ассистент, либо непосредственно Модель. Давайте заглянем немного глубже.

1. Ассистент работает на основе Модель, но он нечто гораздо большее. Модель лишь часть Ассистента, поэтому, прежде чем создавать Агента, нужно понять, что такое Ассистент и как он работает — от этого зависит ваша способность построить действительно эффективного Агента, выполняющего нужные задачи.

Здесь важно осознать ключевое отличие между обычными компьютерными программами, алгоритмами, существовавшими до появления интеллектуальных агентов, и тем, что появилось с развитием искусственного интеллекта и ассистентов.

2. Когда вы создаёте жёсткий алгоритм, технологический процесс или инструкцию — неважно, о какой именно последовательности действий идёт речь, — вы заранее определяете формат входных данных. Вы точно задаёте, какую информацию должен предоставить пользователь. Соответственно, алгоритм обрабатывает эту информацию строго по заложенным правилам.

У такого подхода есть и плюсы, и минусы.

Минус в том, что алгоритм негибкий: что заложено изначально, то он и выполняет. Если, например, робот запрограммирован на ремонт квартиры, он будет следовать инструкции без возможности отклониться от неё, даже если возникнет нестандартная ситуация.
Но есть и плюс: если всё работает как задумано, алгоритм выполняет задачу точно и предсказуемо. То есть результат всегда будет таким, каким его ожидали.

Когда же мы используем искусственный интеллект в его нынешнем виде, ситуация меняется.

Главное преимущество ИИ — это гибкость: он может работать с неточными инструкциями, додумывать детали, искать дополнительные данные, даже если о них не просили. Он умеет справляться с неопределённостью, чего жёсткие алгоритмы делать не могут. Это открывает огромные возможности.

Но есть и обратная сторона: сам процесс «размышлений» модели — это условная, статистически вероятностная процедура. А значит, её результат не всегда предсказуем. Иногда модель выдаёт логичный ответ, иногда — неожиданный, а иногда и вовсе придумывает несуществующие факты (это явление называют «галлюцинациями»).

Таким образом, у нас есть два подхода:

— Чёткий, но негибкий исполнитель, который делает ровно то, что сказано, не выходя за заданные рамки.
— Гибкий и креативный, но непредсказуемый помощник, который способен адаптироваться, но может допускать ошибки.

3. Здесь важно найти баланс. Именно поэтому нужно понимать, как работает ассистент. Мы обсудим это чуть позже.

Но ключевая идея в том, что результат работы Ассистента напрямую зависит от постановки задачи. Если при взаимодействии с Ассистентами кажется, что они «тупят», отвечают невпопад или делают не то, что нужно, то в 99% случаев проблема не в нем, а в некорректной постановке задачи.

Думаю, для большинства это очевидно. Когда вы нанимаете человека для выполнения задачи, чем точнее и понятнее вы объясните, что именно нужно сделать, тем выше шанс, что работа будет выполнена правильно.

С Ассистентом ситуация схожая, но с дополнительными нюансами: возможны галлюцинации, дрейф, деградация диалога и другие специфические особенности технологии. Но в целом принцип остаётся тем же: если вы правильно ставите задачу, вы получаете правильный результат.

Теперь вопрос: почему так важно научиться правильно работать с Ассистентами?

4. Потому что Агент — это, по сути, просто цепочка Ассистентов. Точнее сказать, у вас может один Ассистент или группа, но всегда есть цепочка заданий для него или группы Ассистентов. Понимаете, да? Ассистент — это как джин, который делает то, что вам нужно. Однако, чтобы Ассистент превратился в Агента, ему нужна дорожная карта: что делать, по каким этапам, какие данные использовать и так далее.

5. Каждое задание — это инструкция для Ассистента. Вы должны объяснить, что и как Ассистент должен выполнять. И здесь засада.

Если вы не умеете формулировать задачи даже на уровне одного запроса, то построить полноценного Агента не получится.

Сейчас уже есть множество инструментов для создания Агентов — от простых до сложных. Но суть остаётся неизменной: если вы не знаете, чего хотите, не формулируете чёткую задачу и не даёте достаточный контекст, вы не получите нужного результата.

Даже в обычном диалоге с Ассистентом, когда кажется, что он «глючит», причина чаще всего в неправильном взаимодействии. Если вы не научились правильно работать с Ассистентом на уровне одного запроса, то тем более не сможете выстроить систему из множества взаимодействий.

Поэтому давайте разберёмся, как работает Ассистент.

6. На самом деле, ничего сложного в этом нет. Я не буду углубляться в технические детали — в них сейчас нет необходимости. Итак, что из себя представляет ассистент? Ассистент фактически состоит из двух частей:

1. Языковая модель (LLM) — она отвечает за генерацию ответов, условно говоря, «размышляет» и «думает».
2. Контекст — память или база данных, которые позволяют учитывать предыдущие взаимодействия.

Что это значит?

Представьте, что вы беседуете с человеком. Разговор длится какое-то время, и естественно предположить, что ваш собеседник помнит, о чем вы говорили 5–10 минут назад. Возможно, не в деталях, но общий смысл сохраняется. Более того, если вы пообщаетесь сегодня, а затем созвонитесь через пару дней или даже через месяц, он все равно будет в курсе происходящего.

Если вы работаете в команде над проектом, ваши обсуждения, созданные документы, написанный код — все это формирует общий контекст, который придает смысл дальнейшей работе.

Так вот, без этого контекста языковая модель напоминает «умного глупца». Это все равно что разговаривать с человеком, у которого полная амнезия краткосрочной памяти. Он осмысленно отвечает на ваши слова, но если разговор продолжается, тут же забывает, о чем шла речь.

То же самое происходит и с моделью без памяти: она помнит только текущую сессию. В ходе диалога держит в уме 5–10 последних реплик, но как только вы закроете чат и откроете новый — все забудется. Именно поэтому при использовании через API модель может казаться «тупой».

Когда же Модель превращается в Ассистента?

7. Тогда, когда ваши запросы не просто передаются модели, но и записываются в память. Это позволяет учитывать разные сессии, загружать документы, работать с базами знаний и другими объектами.

Важно понимать, что ассистент помнит контекст не так, как человек. Его память организована иначе — это не просто база данных, а сложная система, позволяющая анализировать и использовать предыдущие взаимодействия. Хотя многие компании утверждают, что ассистенты не хранят данные о прошлых сессиях, на практике это не всегда так. Но и это еще не все.

8. Когда вы общаетесь с ассистентом, кажется, будто вы взаимодействуете с одной «личностью». На самом деле это не так. Внутри системы работают сразу несколько моделей, каждая из которых выполняет свою задачу.

1. Одна модель пытается понять, что вы сказали.
2. Другая анализирует запрос и ищет информацию в базе данных или памяти.
3. Еще одна формирует ответ и проверяет его на логичность.

Все эти процессы происходят параллельно, и когда система находит наиболее подходящий ответ, он передается вам.

Этот механизм называется оркестрированием — процессом координации нескольких моделей, работающих вместе для достижения лучшего результата.

Таким образом, Ассистент — это не просто языковая модель, а комплексная система, в которой несколько моделей работают в связке с контекстной памятью. Это и делает взаимодействие с ним осмысленным и полезным.

Когда вы будете создавать продвинутых Агентов, вам нужно фокусироваться на двух вещах:

1. Последовательность задач, которые агенты должны решать.
2. Определение инструментов для выполнения этих задач. Что это значит?

9. Некоторые задачи целесообразно решать с помощью Ассистента, другие можно передать сторонним сервисам или алгоритмам.

Допустим, у вас есть процесс (например, в бухгалтерии, маркетинге или работе с кадрами), состоящий из десяти шагов. Вы понимаете, что на пяти из них полезно задействовать ИИ Ассистента, потому что он запоминает контекст, позволяет загружать документы и так далее. Значит, вам нужно правильно выстроить взаимодействие.

А это приводит нас к ключевому моменту: на каждом этапе необходимо грамотно формулировать промпт (запрос).

Напоминаю: насколько правильно вы зададите вопрос, настолько адекватный ответ получите. И вот здесь мы подходим к плохой новости.

Плохая новость в том, что когда я проводил небольшой опрос, выяснилось:

…хотя многие пользуются чатами вроде GPT, большинство используют лишь 5% их возможностей. По сути, они не умеют ими эффективно пользоваться.

У многих создаётся впечатление, что с Ассистентом достаточно просто разговаривать — и всё. Но на самом деле у него гораздо больше возможностей.

Когда вы работаете с Ассистентом, важно, чтобы он был не просто механическим инструментом, а полноценным интеллектуальным партнёром. Это возможно, если знать все функции ChatGPT. Они, кстати, несложные. Разумеется, нужен платный тариф (20 долларов).

Но давайте честно: если для вас эти 20 долларов — проблема, то дальше обсуждать нечего.

Многие мои знакомые подписаны не на один ИИ, а на несколько, и в этом есть смысл. Мы вкладываем деньги в возможности, а стоимость подписки — минимальная. На платных тарифах доступен расширенный функционал: работа с контекстом, промптами, проектами и многими другими возможностями. Они позволяют использовать GPT в 100 раз эффективнее, чем просто в обычном режиме общения.

Если вы используют крошечную часть возможностей ChatGPT, то часто не получаете результата, который могли бы. ChatGPT мог бы дать гораздо больше, но не даёт — потому, что вы не потрудились разобраться в его возможностях.

Часто наше небольшое невежество становится непреодолимой стеной между нами и сияющими возможностями. Это и есть плохая новость.

Но есть и хорошая новость. Когда я смотрю, как пользуются ChatGPT другие, я переполняюсь сочувствием от того, что люди не используют ChatGPT на полную.

Я сделал короткий и бесплатный курс «Как эффективно использовать ChatGPT?», который вы сейчас уже читаете.

В курсе я систематизировал свои практики, поэтому это скорее мастер-класс. Получилось около 10 часов. Я показываю возможности и добавил небольшие тесты.

Почему так важно сначала разобраться с тем же ChatGPT?

(или аналогом, хотя пока их мало — Антропик, Дипсик, Groc3 и т.п.)

Потому что, если вы освоите его возможности, то сможете сделать его полноценным партнёром, который решает огромное количество задач.

Я уверен, большинство из вас используют 5-10% возможностей ChatGPT. А когда вы поймёте все его функции и как с ними работать, вы выйдете на другой уровень.

Поймите, идея в том, чтобы вы использовать ChatGPT в качестве преподавателя и партнера без человека.

ИИ Ассистент может многое объяснять, у него всегда есть время, он всегда стремится помочь, он дает качественный ответ на почти любой вопрос. Но есть нюанс. Что это за нюанс?

Помните, если вы хотите получить хороший ответ, то должны задать правильный вопрос. Когда речь идёт об обучении, важно не только получать информацию, но и понимать, какие вопросы стоит задавать.

Да, chatGPT может ответить почти на любой вопрос.Но есть нюанс.

Но если вы не разбираетесь в предмете, то не знаете, какой вопрос задать и в какой последовательности. Начинаете улавливать?

Представьте, что вы находитесь в огромной комнате. У вас есть ключ, и вам нужно найти замочную скважины, чтобы выйти из темницы. Ключ у вас уже в руках, но замочную скважину не видно. Вы можете искать её очень долго. А если это не просто комната, а целый замок? Всё, что связано с искусственным интеллектом, больше похоже на замок.

Вы ходите с ключом по этому замку, задаёте вопросы, но не двигаетесь вперёд. Потому что вы не знаете, где замочная скважина. Вы не знаете, какой задать вопрос. Если есть кто-то, кто скажет: «Вот замочная скважина», вы открываете дверь — и идёте в новый мир. Вот, собственно, в этом и есть ценность курса.

Практически весь материал, который я использую, можно найти в интернете. Огромное, чудовищное количество ссылок — всё это бесплатно, доступно, можно смотреть. Но есть проблема: всё это раскидано по разным местам. Многие статьи, сервисы, инструменты требуют не просто изучения, а понимания и практики.

Разобраться самому, конечно, можно. Но у 99% людей на это просто не хватит времени, силы воли и настойчивости. Это непросто. Такова реальность.

  • Я стараюсь эту проблему решить. Я собираю всё в одном месте, компактно. Я уже потратил это время.
  • Плюс, я всегда объясняю понятно, потому что смотрю на ситуацию не как технарь, а как человек, которому важно получить результат, пользу. Если речь о бизнесе — значит, я подхожу с этой стороны.
  • Я не углубляюсь в технологии больше, чем это необходимо.
  • Я делаю так, что вы не просто читаете, а начинаете понимать, что это и как это применить.
Прокрутить вверх