Raindrop Workshop за допомогою Codex допомагає вашому AI-агенту автоматично знаходити баги та виправляти їх (безкоштовне відкриття коду)

AI Агент інструмент розробника Raindrop цього тижня відкрив вихідний код локального налагоджувача Workshop (v0.1.6), що дозволяє розробникам у реальному часі відстежувати кожен вихідний токен агента та виклики інструментів, а також через MCP автоматично дозволяє Claude Code читати, писати тести та виправляти помилки.
(Передісторія: Чи справді Claude пише код ігнорує правила? Модифікація 12 правил Andrej Karpathy, щоб знизити рівень помилок з 41% до 3%)
(Додатковий контекст: Anthropic запустила «Claude for Small Business»: орієнтований на малий та середній бізнес для автоматизації AI)

Ваш AI Агент щойно видав дивний результат. Він обрав несподіваний інструмент і видав неоднозначну відповідь. Ви відкриваєте лог, і бачите купу API викликів і чисел токенів, але жодних підказок, де сталася помилка.

Raindrop 14 травня випустила відкритий інструмент, який намагається зробити так, щоб це більше не повторювалося: повністю локальний, безкоштовний Workshop для налагодження AI Агентів. Це дозволяє розробникам у реальному часі відстежувати кожен вихідний токен і виклики інструментів, а процес налагодження делегувати Claude Code або Codex.

Чому саме налагодження AI Агентів таке складне?

Традиційне налагодження програм — це точки зупину, повний стек викликів, детермінований шлях виконання. У випадку AI Агентів все інакше. Їх поведінка ймовірнісна, однаковий вхід може вести до різних результатів; їх рішення формуються через багаторівневі виклики LLM, і лише кінцевий вихід не дає зрозуміти логіку.

Суть проблеми: ви не шукаєте «де помилився код», а «на якому кроці агент прийняв несподіване рішення у конкретному контексті». Такі питання важко діагностувати за допомогою традиційних дебаггерів.

Існуючі рішення зазвичай мають два підходи:

  • перший — хмарна платформа моніторингу, що надсилає трасу до сторонніх сервісів для аналізу через панель інструментів
  • другий — вставляти у код власний логінг, що вимагає багато часу і зусиль

Перший підхід не підходить для розробників з проблемами конфіденційності, другий — вимагає постійного обслуговування та оновлення при оновленнях фреймворків. Обидва мають спільну проблему: вони показують «що сталося», але не допомагають «виправити».

Workshop обрав третій шлях: повністю локальне виконання, без передачі даних на зовнішні сервери, з відкритим кодом і безкоштовно, щоб AI міг безпосередньо брати участь у процесі налагодження.

Як працює Workshop

Після запуску Workshop запускає локальний візуальний інтерфейс і відкриває MCP (Model Context Protocol) Server. MCP — це «стандартний протокол зв’язку для виклику зовнішніх можливостей AI інструментами» — міст для читання зовнішніх даних Claude Code та інших AI інструментів.

Після підключення SDK, кожен вузол виконання агента — кожен вихідний токен, кожен виклик інструменту, кожна гілка рішення — миттєво з’являється у localhost:5899 у потоковому режимі, без опитування або ручного оновлення.

Простими словами: на вашому комп’ютері відкривається моніторинг-екран, і ви бачите у реальному часі, що робить AI Агент.

Головна ідея Workshop — інтегрувати Claude Code та інші допоміжні інструменти у цикл налагодження. Оскільки MCP Server відкритий, Claude Code може безпосередньо читати трасу, писати eval тести, запускати їх, аналізувати невдачі, редагувати код агента і запускати знову — доки всі тести не пройдуть.

Raindrop називає цей цикл «самовідновлювальним eval-циклом». Весь процес — локальний, без участі зовнішніх сервісів: Claude Code читає трасу, пише тести, дивиться на невдачі, редагує код і перезапускає — без втручання розробника.

Workshop також підтримує функцію Replay: завантажує трасу з реального середовища і виконує її у локальній копії, щоб зробити регресійне тестування. Це особливо корисно, коли помилка виникла у продакшені, але важко її відтворити — можна просто запустити реальну трасу і швидко знайти проблему.

CODEX-0,65%
TOKEN-0,09%
ANTHROPIC-1,54%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено