Как правильно работать с ИИ в проектах с богатыми текстовыми данными: несколько практических приёмов.

О чём пойдёт речь? О применении ИИ в виде скилов и агентов к проектам, где основное содержимое — это разнообразные и насыщенные текстовые данные. Например, статьи, аналитика, сырые отчёты или, наоборот, результаты исследований, документы, регламенты, протоколы встреч и тому подобное. В общем, это не код и не числовой анализ.

Погнали!

**Файловая структура.** Обеспечьте правильные имена файлов и каталогов. В большинстве случаев хороший агент сам всё прочитает и поймёт. Если же нет — подскажите ему в правилах проекта, в `claude.md`, или банально опишите структуру в индексных файлах.

**Воркфлоу.** Агент должен понимать логику движения информации между документами. Что служит исходными данными, откуда черпать информацию, а что является целевым результатом, куда её записывать. На каждом шаге это могут быть совершенно разные документы. Если не указать это явно, ИИ легко перепутает порядок.

**Полнота, но не перегрузка.** Агент должен иметь доступ ко всей полноте информации в проекте, но не обязан тянуть её всю в контекстное окно. Следите за этим балансом — это критично для эффективности и стоимости.

**Таксономия.** Используйте элементарный вики-синтаксис для перелинковки. Сущности и понятия в документах должны быть хорошо связаны между собой — иногда расстановка этих взаимных ссылок требует отдельных шагов в пайплайне.

**Инструменты поиска.** Дайте агентам доступ к разным механизмам:
– файловый поиск;
– индексный поиск (RAG);
– графовый поиск по таксономии.
Уделите время, посидите с агентом, погоняйте поиск отдельно, заставляя его корректировать свои подходы. Все инсайты обязательно запишите в правила проекта. Комбинирование этих механизмов и итеративная доработка стратегий поиска значительно улучшают производительность агентов.

**Ход течения времени.** Если ваши документы меняются со временем и это имеет бизнес-смысл, обязательно положите проект в Git. Целенаправленно укажите агенту, чтобы он пользовался историей репозитория. Сами агенты пока до этого не додумываются. Из истории изменений можно извлечь массу ценных трендов, например, для отслеживания эволюции информации. Исследования подтверждают: анализ Git-диффов и логов значительно улучшает «память» агентов. При этом важно оптимизировать историю Git и встроенную документацию для корректной интерпретации ИИ.

**Метки Git для периодических запусков.** Используйте метки Git для отметки запусков периодических агентов. Схема проста: агент запустился, отработал, закоммитил результат, поставил `git tag`. При следующем запуске банальный `diff` между меткой и `HEAD` даст агенту перечень новых файлов для обработки. Это изящно, легко и не требует ведения внешнего учёта в базе данных.

**Память в пайплайнах.** В идеале пайплайны должны состоять из атомарных шагов. Но на практике агенты могут неявно сохранять что-то в «память» проекта. Она обычно видна и доступна — не поленитесь заглянуть, что там. Это может критически влиять на долгосрочный результат и на переносимость вашего воркфлоу в другие проекты.

**Контракты между скилами.** Если у вас есть последовательность запуска, например, `/market-analyze` и `/product-update`, буквально проектируйте формат передачи данных «между ними». Необязательно, чтобы это была физическая передача, но согласованный набор полей у обоих — это настоящее золото.

**Вишенка на торте — эвалы.** Для тех, кто родился до 2000 года, это называется автотесты. Держите под рукой эталонные тексты для прогонки скилов и сравнения результатов с ожиданиями — желательно не внутри самого проекта. Привыкайте относиться к скилам как к внешним библиотекам в программировании: с полным циклом SDLC, версиями релизов и автоматическими тестами. ИИ отлично подходит для помощи в тестировании, помогая генерировать идеи, анализировать данные и создавать тестовый код.

Что ещё? Делитесь своими приёмами в комментариях!