Ф'ючерси
Сотні безстрокових контрактів
CFD
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
IPO Access
Отримайте повний доступ до глобальних IPO акцій.
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Акції
Центр діяльності
Беріть учать та отримуйте винагороди
Реферал
20 USDT
Запрошуйте друзів та отримуйте бонуси
Партнерська програма
Ексклюзивні комісійні винагороди
Gate Booster
Зростайте та отримуйте аірдропи
Оголошення
Оновлення платформи в реальному часі
Блог Gate
Статті про криптоіндустрію
VIP послуги
Величезні знижки на комісії
Управління активами
Універсальне рішення для управління активами
Інституційний
Рішення цифрових активів для бізнесу
Розробники (API)
Підключається до екосистеми додатків Gate
Позабіржовий банківський переказ
Поповнюйте та виводьте фіат
Брокерська програма
Щедрі механізми знижок API
AI
Gate AI
Ваш універсальний AI-помічник для спілкування
Gate AI Bot
Використовуйте Gate AI безпосередньо у своєму соціальному додатку
GateClaw
Gate Блакитний Лобстер — готовий до використання
Gate for AI Agent
AI-інфраструктура, Gate MCP, Skills і CLI
Gate Skills Hub
Понад 10 000 навичок
Від офісу до трейдингу: універсальна база навичок для ефективнішої роботи з AI
GateRouter
Розумний вибір із понад 40 моделей ШІ, без додаткових витрат (0%)
Чому вам потрібно вивчати Інженерію підключень? Повний аналіз 5 продуктів, 3 шкіл та 5 універсальних принципів
система розбору Harness Engineering 5 продуктів, 3 школи (OpenAI / Anthropic / ThoughtWorks), 5 універсальних принципів, і чому «Занепад Harness» змушує вас кожні 6 місяців відрізати половину дизайну. Ця стаття походить з X-статті @sairahul1, зібрана та перекладена Dynamic Zone.
(Попередній огляд: Вступ до Harness Engineering (AI-управління інженерією): Новий стандарт програмування OpenAI, що допоможе легко досягти Lv.1)
(Додатковий фон: Генеральний директор YC ділиться секретами AI: Майбутнє належить тим, хто зможе побудувати системи інформативного складного відсотка)
Зміст статті
Перемикач
У лютому 2026 року, команда OpenAI створила 1 мільйон рядків виробничого коду.
Вони не писали жодного рядка вручну.
Це писали агенти AI.
Людський дизайн — це система, яка робить агентів надійними.
Цю систему тепер називають — Harness Engineering.
За кілька тижнів Anthropic опублікувала 3 релевантні статті. ThoughtWorks систематизувала її у рамки. Philipp Schmid з Hugging Face прямо назвав її «найважливішою дисципліною 2026 року».
За 90 днів з’явилася нова інженерна галузь. І поза командою AI infra майже ніхто не зрозумів.
Ця стаття пояснює її чітко. Без зайвих слів, без академічної термінології — лише ті ментальні моделі, які справді потрібні для застосування.
1. Визначення Harness
Найпростіше визначення від ThoughtWorks:
Harness — це все, що окрім моделі.
Зняти harness → залишиться сирий мовний модель, що «вгадує» у вашому коді.
Додати правильний harness → отримати систему, здатну генерувати виробничий код.
Це слово походить від упряжі. Harness — це вуздечка, сідло, упряж — спрямовує сильну, але непередбачувану силу тварини у корисний напрям.
Ви не робите тварину розумнішою, ви створюєте обладнання, що робить її силу корисною.
2. Метафора ОС
Найкраща технічна метафора від Philipp Schmid: уявіть це як комп’ютер.
| Роль | | --- | | Модель | Центральний процесор (потужність) | | Контекстне вікно | ОЗП (обмежена, швидко вичерпна робоча пам’ять) | | Harness | ОС (керує тим, що і коли бачить CPU) | | Агент | Застосунок, що працює зверху |
Ваша модель дуже потужна. Але без ОС, що керує пам’яттю, планує задачі, встановлює правила — вона просто шматок кремнію.
Більшість працює «без операційної системи». Тому їхні агенти виходять з ладу на виробництві.
3. Що саме змінилося в 2026 році
LangChain використовує ту саму модель і запускає її двічі на Terminal Bench 2.0:
| Harness | | --- | Оцінка | | --- | --- | | Старий harness | 52.8% | | Новий harness | 66.5% |
Та сама модель. Різний harness. Різниця 13.7 процентних пунктів.
Vercel навпаки — зменшила кількість інструментів агента на 80%. Результат? Краще, а не гірше.
Найбільш неприємна правда 2026 року:
Якщо 2025 — рік, коли AI агент довів, що може писати код, то 2026 — рік, коли відкрили, що «оточення» важливіше за «модель».
4. Файл AGENT.md / CLAUDE.md
Найзагальніший продукт harness.
Розкидані по всьому кодовому базі markdown-файли. Агент кожного разу починає сесію з їхнього читання — як onboarding для нового співробітника.
Що в них?
OpenAI називає це AGENT.md. Anthropic — CLAUDE.md. Cursor — .cursorrules.
Різні назви, однаковий принцип. Кожен основний модуль — окремий файл. Оновлюється з розвитком проекту.
Без нього: агент кожного разу — сліпий запуск. З ним: агент кожного разу — з інформацією.
5. JSON Feature Lists (система відстеження прогресу)
Коли агент працює через кілька сесій над цим самим додатком, контекстне вікно кожної — порожнє. Як він знає, що вже зроблено?
Файл JSON.
Кожен запис — це:
Агент читає його на початку сесії — вибирає найвищий пріоритет Fail → реалізує → позначає Pass → комітить → повторює.
Чому саме JSON, а не Markdown?
Anthropic виявила: ймовірність перезапису JSON агентом нижча, ніж Markdown.
Дрібниці, але у сценарії автономної роботи 6 годин — це критично.
6. Стандарт ініціалізації сесії
Кожна сесія починається однаково. Обов’язково.
7-кроковий процес запуску Anthropic:
Без цього: перші 20 хвилин агент намагається з’ясувати поточний стан, повторює одне й те саме. З ним: агент одразу працює з інформацією.
7. Контракти спринту (Sprint Contracts)
Перед написанням будь-якого рядка коду — дві агенти спершу домовляються.
Агент-генератор пропонує:
Агент-оцінювач перевіряє:
Обидва погоджуються — починається реалізація.
Це — дизайн-рев’ю. Але обидва — AI.
Чому це важливо
Якщо агенти одночасно планують і виконують — результати ненадійні. Навіть AI, що планує — значно покращує якість виходу.
8. Структуровані шаблони задач (Structured Task Templates)
Перед будь-яким кодом, harness аналізує реальний кодовий базу.
Він створює заземлену карту впливу:
Після цього — починається реалізація.
Звучить очевидно. Але більшість команд пропускає цей крок.
Агент здогадується структуру файлів, вигадує API, що не існує, створює щось, що не пасує до коду.
Спершу — заземлений контекст, потім — виконання → якість виходу значно вища.
9. Школа OpenAI: пріоритет навколишнього середовища
Команда Codex OpenAI має дивну проблему:
На такому масштабі неможливо робити покроковий код-рев’ю. Тому вони не роблять.
Замість цього — повністю проектують середовище так, щоб агент з самого початку видавав «перевіряємий» результат.
Їхній підхід
Філософія: Проектуй середовище. Потім запускай агента.
Докази
Sora Android app. 4 інженери. 28 днів. Перший у Play Store. 99.9% без збоїв.
Codex щотижня обробля 70% внутрішніх PR.
10. Школа Anthropic: розділення «роботи» і «оцінки»
Anthropic стикається з іншим питанням:
Коли агент оцінює власний вихід — він впевнено хвалить свою роботу — навіть якщо з точки зору людини якість очевидно посередня.
Самооцінка — не працює. Агент одночасно і студент, і викладач, і ставить собі «відмінно» по всіх пунктах.
Їхнє рішення: 3 спеціалізовані агенті
| Агент | | --- | | Planner | Перетворює 2 речення prompt у повну специфікацію продукту | | Generator | Реалізує один sprint за раз | | Evaluator | Автоматизоване тестування у браузері, імітуючи реального користувача |
Інсайт: зробити «незалежного» evaluator більш вибагливим — легше, ніж змусити generator бути більш критичним до себе.
Результати (A/B тестування)
| Налаштування | | --- | | Вартість | | Час | | Результат | | --- | --- | --- | --- | | Один агент (без harness) | $9 | 20 хвилин | Погане додаток | | Повний harness | $200 | 6 годин | Робочий софт + гарний інтерфейс |
11. Школа ThoughtWorks: матриця 2×2
ThoughtWorks підходить з іншого боку — вони не створюють продукт, а аналізують, чому понад 50 команд зазнають невдачі у схожих ситуаціях.
Їхній інсайт: класифікація harness за двома осями
Ось 1: коли працює?
Ось 2: як працює?
Матриця 2×2
| | | --- | | Feedforward | настанови | | Feedback | сенсори | | --- | --- | --- | | Обчислювальний | типова система, лінтер, архітектурні правила | тестовий набір, покриття, мутаційне тестування | | Інференційний | специфікація, обмеження | LLM code reviewer, поведінковий валідатор |
Feedforward і feedback — обидва потрібні. Не можна використовувати лише один.
12. Принцип 1: Контекст важливіший за інструкцію
Різні команди, однакові відкриття:
Зв’язати з реальними файлами → адаптувати код до бази. Виходити з розпливчастих описів → уявних API.
Перед тим, як агент почне писати, переконайтеся, що він знає, де знаходиться.
13. Принцип 2: Планування і виконання мають бути розділені
Кожна школа виявила: одночасне планування і виконання агентом — ненадійно.
Планування — не обов’язково має робити людина, але має бути окремим кроком, і його результат має бути перевірений перед початком.
14. Принцип 3: Цикл зворотного зв’язку — незамінний
Три школи — однаковий принцип, три підходи:
| Школа | | --- | джерело зворотного зв’язку | | --- | --- | | OpenAI | автоматичне тестування + CI | | Anthropic | інший LLM | | ThoughtWorks | об’єднання обох підходів |
Вони різняться у тому, хто саме дає зворотний зв’язок. Але не різняться у тому, чи потрібен він взагалі.
15. Принцип 4: Робити можна лише одну річ за раз
Якщо агент намагається зробити багато —:
Загальна практика Anthropic: читати прогрес → обрати один feature → реалізувати → закомітити → повторювати.
«Принцип поступового руху вперед» — спільна риса всіх успішних harness.
16. Принцип 5: Кодова база сама є документом
Ніхто не буде окремо підтримувати базу знань для агента. Репозиторій — єдина істина.
Якщо правило, обмеження або архітектурне рішення не в кодовій базі — агент його не знає.
Практичне значення
17. Занепад Harness (Harness Decay) — це реально
Коли Anthropic оновила Opus з 4.5 до 4.6 — розбиття sprint (спочатку — обов’язковий етап) стало зайвим.
Покращення планувальних можливостей моделі зробило цю частину зайвою.
З березня до квітня компоненти harness, що раніше були критичними, перетворилися на навантаження.
Після запуску Opus 4.7 — модель почала самостійно перевіряти свої виходи, роль Evaluator зменшилася.
Це і є занепад Harness
| Версія моделі | | --- | Стани harness | | --- | --- | | Opus 4.5 | Розбиття sprint + оцінка кожного спринту | | Opus 4.6 | Без розбиття sprint + однократна оцінка (економія 38%) | | Opus 4.7 | Самоперевірка моделі → роль evaluator зменшується |
Створення для видалення (Build to Delete)
Philipp Schmid пропонує: «Build to delete».
Коли проектуєте кожен компонент harness — робіть його таким, щоб його можна було легко видалити.
Регулярно тестуйте кожен компонент — відключіть його і подивіться, чи зменшиться якість виходу. Якщо ні — видаляйте.
| Команда | | --- | Рефакторинг за 6 місяців | | --- | --- | | Manus | 5 разів рефакторили harness | | LangChain | 3 рази за рік | | Vercel | видалили 80% інструментів — і покращили продуктивність |
Це не ознака поганої архітектури. Це — природна реакція на швидкий розвиток моделей.
19. Реальність витрат
Чесні дані A/B тестів Anthropic:
| Налаштування | | --- | Витрати | Час | Результат | | --- | --- | --- | --- | | Один агент (без harness) | $9 | 20 хвилин | Зламаний інтерфейс, неправильна фізика | | Повний harness (Opus 4.5) | $200 | 6 годин | Робочий софт, гарний UI, правильна фізика |
В 22 рази дорожче — для реального продукту, а не просто демонстрації.
Чи варто? Залежить від того, скільки коштує вашому команді зіпсований реліз.
Тут говорять про те, що зазвичай не обговорюють
Комбінація harness + модель — це еволюційний процес.
$200 harness після оновлення моделі — стає $124.
| Тренд | | --- | | Краща модель = простий harness = дешевше запускати = швидше вихід |
Повний виклад
Що таке harness
5 продуктів harness
3 школи
5 універсальних принципів
Парадоксальні моменти
Переможці 2026 року — це не ті, хто пише найкращий код. Вони — ті, хто проектує найкращі «обмеження» — і готові їх відкидати, коли вони перестають бути вигідними.