Фьючерсы
Доступ к сотням фьючерсов
CFD
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
IPO Access
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
Промоакции
Участвуйте и получайте награды
Реферал
20 USDT
Приглашайте друзей за бонусы
Партнерская программа
Эксклюзивные комиссионные
Gate Booster
Растите влияние и получайте аирдроп
Анонсы
Обновления в реальном времени
Блог Gate
Статьи о криптоиндустрии
VIP-услуги
Огромные скидки на комиссии
Управление активами
Универсальное решение для управления активами
Институциональный
Крипто-решения для бизнеса
Разработчикам (API)
Подключение к экосистеме приложений Gate
Внебиржевые банковские переводы
Ввод и вывод фиатных денег
Брокерская программа
Щедрые механизмы скидок API
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
GateRouter
Умный выбор из более чем 40 моделей ИИ, без дополнительных затрат (0%)
Почему вам нужно изучать Harness Engineering? Полный разбор 5 продуктов, 3 школ и 5 универсальных принципов
Системный разбор Harness Engineering: 5 продуктов, 3 школы (OpenAI / Anthropic / ThoughtWorks), 5 универсальных принципов, а также почему «Упадок Harness» заставляет вас каждые 6 месяцев сокращать половину дизайна. Эта статья основана на статье @sairahul1, подготовленной и переведённой редакцией.
(Предыстория: Введение в Harness Engineering (AI-управляемая инженерия): последние стандарты программирования OpenAI, позволяющие легко достичь уровня Lv.1)
(Дополнительный фон: Генеральный директор YC делится секретами AI: будущее — у тех, кто умеет строить системы информационного сложного процента)
Содержание статьи
Переключить
В феврале 2026 года команда OpenAI выпустила 1 миллион строк производственного кода.
Без единой рукописной строки.
Это — агенты AI, пишущие код.
Человеческий дизайн — это система, которая делает агента надёжным.
Эту систему теперь называют — Harness Engineering.
За несколько недель Anthropic выпустила 3 связанные статьи. ThoughtWorks систематизировала её в рамки. Philipp Schmid из Hugging Face прямо назвал её «самой важной дисциплиной 2026 года».
За 90 дней сформировалась новая инженерная дисциплина. И кроме команд AI infra, почти никто не понял.
Эта статья — объяснение. Без воды, без академической терминологии, только те ментальные модели, которые реально пригодятся.
1. Определение Harness
Самое простое определение от ThoughtWorks:
Harness — всё, что вне модели.
Удалить harness → получить просто модель языка, которая догадывается внутри вашего кода.
Добавить правильный harness → систему, способную писать производственный код.
Это название происходит от снаряжения для лошадей. Harness — это упряжь, седло, уздечка — направляют мощное, непредсказуемое животное в полезное русло.
Вы не делаете умнее лошадь, вы создаёте экипировку, которая делает её силу полезной.
2. Метафора ОС
Philipp Schmid предлагает лучший технический образец: представьте это как компьютер.
| Роль | | --- | | Модель | | CPU (исходная вычислительная мощность) | | Контекстное окно | | RAM (ограниченная, быстро исчезающая рабочая память) | | Harness | | ОС (управляет тем, что CPU видит и когда) | | Агент | | Запускаемое приложение |
Ваша модель очень сильна. Но без ОС, которая управляет памятью, планирует задачи, задаёт правила — она просто кусок кремния.
Большинство работают «без операционной системы» — запускают приложения. Поэтому их агент ломается сразу на производственной линии.
3. Что действительно изменилось в 2026 году
LangChain использует один и тот же модель, запуская её дважды на Terminal Bench 2.0:
| Harness | | --- | | Баллы | | --- | --- | | Старый harness | 52.8% | | Новый harness | 66.5% |
Та же модель. Разные harness. Разница — 13.7 процентных пунктов.
Vercel поступила наоборот — урезала инструменты агента на 80%. Результат? Лучше, а не хуже.
Самое неприятное в 2026 году:
Если 2025 — год, когда AI-агенты доказывали, что умеют писать код, то 2026 — год, когда стало ясно, что «окружение» важнее «модели».
4. Файл AGENT.md / CLAUDE.md
Самый универсальный продукт harness.
Разбросан по всему коду markdown-файлы. Агент читает их при каждой сессии — как onboarding для нового инженера.
Что в них?
OpenAI зовёт его AGENT.md. Anthropic — CLAUDE.md. Cursor использует .cursorrules.
Разные названия, один принцип. Одна копия на каждый модуль. Обновляется по мере развития проекта.
Без него: агент каждый раз запускается вслепую. Есть — агент работает с информацией.
5. JSON Feature Lists (системы отслеживания прогресса)
Когда агент работает через несколько сессий над целым приложением, его контекстное окно пустое. Как он узнает, что уже сделано?
JSON-файл.
Каждая запись содержит:
При старте сессии агент читает его — выбирает самую приоритетную ошибку → реализует → отмечает как выполненную → коммитит → повторяет.
Почему JSON, а не Markdown?
Anthropic обнаружила: вероятность перезаписать JSON агентом ниже, чем Markdown.
Мелочь, но в сценариях автономной работы 6 часов — критично.
6. Стандарт инициализации сессии
Каждая сессия начинается одинаково. Обязательно.
7-шаговая процедура Anthropic:
Без этого: первые 20 минут агент разбирается в текущем состоянии, повторяет одни и те же действия. С ним: агент сразу знает, что делать.
7. Sprint Contracts (контракты спринта)
Перед написанием любой строки кода — два агента договариваются.
Generator agent предлагает:
Evaluator agent проверяет:
Если оба согласны — начинается реализация.
Это — дизайн-ревью. Только оба — AI.
Почему это важно
Когда в одном цикле агент планирует и выполняет, результат ненадёжен. Даже AI, выполняя оба этапа, значительно повышает качество результата.
8. Структурированные шаблоны задач
Перед написанием кода harness сначала анализирует реальный codebase.
Он создаёт заземлённую карту воздействия:
Затем начинается реализация.
Звучит очевидно. Но большинство команд пропускают этот шаг.
Агент угадывает структуру файлов, придумывает несуществующие API, делает что-то, что не сочетается с codebase.
Заземлённый контекст — вначале, затем выполнение — качество результата значительно выше.
9. Школа OpenAI: приоритет окружения
Команда Codex OpenAI столкнулась с абсурдной проблемой:
На таком масштабе невозможно делать ручной ревью. Поэтому — они не делают этого.
Взамен — они проектируют окружение так, чтобы агент сразу выдавал «поддающиеся проверке» результаты.
Их подход
Философия: Проектируйте окружение. Потом запускайте агента.
Доказательства
Приложение Sora для Android. 4 инженера. 28 дней. Первое место в Play Store. 99.9% без сбоев.
Codex обрабатывает 70% внутренних PR каждую неделю.
10. Школа Anthropic: разделение «делать» и «оценивать»
Anthropic сталкивается с другой проблемой:
Когда агент оценивает свои результаты, он хвалит себя — даже если по мнению человека качество посредственное.
Самооценка — не работает. Агент — и студент, и учитель, и ставит себе «отлично» по всем параметрам.
Их решение: 3 специализированных агента
| Агент | | --- | | Работа | | --- | --- | | Planner | | Преобразует 2-словный запрос в полное техническое задание | | Generator | | Реализует по одному спринту | | Evaluator | | Автоматизированное тестирование через браузер, имитируя реального пользователя |
Инсайт: сделать «независимый» evaluator более придирчивым — гораздо проще, чем заставлять generator критиковать свою работу.
Результаты (A/B тесты)
| Настройка | | --- | | Стоимость | | Время | | Результат | | --- | --- | --- | --- | | Один агент (без harness) | $9 | 20 минут | Плохое приложение | | Полный harness | $200 | 6 часов | Рабочий софт + аккуратный UI |
11. Школа ThoughtWorks: матрица 2×2
ThoughtWorks подходит с другой стороны — они не создают продукт, а изучают 50+ команд, терпящих неудачу в одинаковых местах.
Их инсайт: классификация harness по двум осям
Ось 1: Когда работает?
Ось 2: Как работает?
Матрица 2×2
| | | --- | | Feedforward (направляющие) | | Feedback (датчики) | | --- | --- | --- | | Computational | | тип-системы, линтеры, архитектурные правила | | тестовые наборы, покрытие, мутационные тесты | | Inferential | | спецификации, ограничения | | LLM для ревью кода, поведенческие верификаторы |
Feedforward и feedback — нельзя использовать отдельно. Нужно оба.
12. Принцип 1: Контекст важнее инструкции
Разные команды, одно открытие:
Привязка к реальным файлам → адаптация к коду. От расплывчатых описаний — к иллюзиям API и изобретению новых путей.
Перед тем, как начать писать, убедитесь, что агент знает, где он.
13. Принцип 2: планирование и выполнение должны быть разделены
Каждая школа пришла к выводу: если агент одновременно планирует и выполняет, результат ненадёжен.
Планирование — не обязательно должно делать человек, но оно должно быть отдельным шагом, и его результат — проверен.
14. Принцип 3: Обратная связь — обязательна
Три подхода по принципу:
| Школа | | --- | | Источник обратной связи | | --- | --- | | OpenAI | | Автоматизированное тестирование + CI | | Anthropic | | Другой LLM | | ThoughtWorks | | Использование обоих вместе |
Различия — кто даёт обратную связь. Но в вопросе «нужна ли она» — нет разногласий.
15. Принцип 4: делай только одно за раз
Много задач одновременно — это:
Обычно Anthropic: читаешь прогресс → выбираешь один feature → реализуешь → коммитишь → повторяешь.
«Принудительный постепенный подход» — общий признак успешных harness.
16. Принцип 5: Код — это документация
Никто не будет держать отдельную базу знаний для агента. Репозиторий — это единственная истина.
Если правило, ограничение или архитектурное решение не в коде — агент этого не знает.
Практическое значение
17. Упадок Harness (Harness Decay) — реальность
Когда Anthropic обновила Opus с 4.5 до 4.6 — разбиение спринтов (которые раньше было обязательно) стало тяжёлым бременем.
Модель улучшилась — и эта часть стала избыточной.
В марте ещё работали компоненты harness, а в апреле — уже только overhead.
Затем вышел Opus 4.7 — модель начала проверять свои выводы, роль Evaluator сократилась.
Вот что такое упадок Harness
| Версия модели | | --- | | Статус harness | | --- | --- | | Opus 4.5 | | Разбиение спринтов + оценка каждого спринта | | Opus 4.6 | | Без разбиения спринтов + однократная оценка (сэкономлено 38% стоимости) | | Opus 4.7 | | Модель сама проверяет — роль evaluator сокращается |
Зачем строить для удаления (Build to Delete)
Philipp Schmid советует: «Стройте так, чтобы можно было удалить».
При проектировании каждого компонента harness — делайте его легко удаляемым.
Регулярно тестируйте — выключите его и посмотрите, ухудшится ли качество.
Если нет — удаляйте.
| Команды | | --- | | Рефакторинг за 6 месяцев | | --- | --- | | Manus | | 5 раз рефакторили harness | | LangChain | | 3 раза за год | | Vercel | | Удалили 80% инструментов — результат лучше |
Это — не признак плохой инженерии. Это — естественный результат «быстрого прогресса моделей».
19. Реальность затрат
Честные цифры A/B теста Anthropic:
| Настройка | | --- | | Стоимость | | Время | | Результат | | --- | --- | --- | --- | | Один агент (без harness) | $9 | 20 минут | Интерфейс работает, ядро — сломано | | Полный harness (Opus 4.5) | $200 | 6 часов | Рабочий софт, аккуратный UI, правильная физика |
В 22 раза дороже — чтобы получить реально работающий продукт, а не просто демонстрацию.
Стоит ли? Зависит от того, сколько стоит для вашей команды сбой релиза.
Но это — часть, о которой никто не говорит
Комбинация harness + модели — эволюционная.
$200 harness после обновления модели стоит всего $124.
| Тренд | | --- | | Лучшие модели = проще harness = дешевле запуск = быстрее результат |
Полное резюме
Что такое harness
5 продуктов harness
3 школы
5 универсальных принципов
Парадоксальные моменты
Победители 2026 года — это не те, кто пишет лучший код. Это те, кто проектирует лучшие «ограничения» — и готовы их выбросить, когда они перестают приносить прибыль.