Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Pre-IPOs
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Google выпустила ReasoningBank, интеллектуальные системы извлекают стратегии рассуждения из опыта успехов и неудач
Битсайт сообщает, что согласно мониторингу Beating, исследовательский институт Google выпустил рамочную структуру памяти для интеллектуальных агентов ReasoningBank, позволяющую моделям с большим числом параметров постоянно обучаться после развертывания. Основной подход заключается в том, чтобы обобщить опыт успешных и неудачных задач в универсальные стратегии рассуждения и сохранить их в памяти, чтобы при столкновении с похожими задачами сначала осуществлять поиск, а затем выполнять. Связанная статья опубликована на ICLR, код уже открыт на GitHub. Ранее существовали два основных подхода, каждый из которых имел недостатки: Synapse записывает полный маршрут действий, что слишком детально и трудно переносимо; Agent Workflow Memory извлекает рабочие процессы только из успешных случаев. ReasoningBank изменил два аспекта: объект хранения заменен с «последовательности действий» на «модель рассуждения», каждая запись содержит структурированные поля: заголовок, описание и содержание; также включены неудачные маршруты для обучения. Модель вызывает другую большую модель для самопроверки выполненного маршрута, а неудачный опыт разбит на правила избегания ошибок, например, вместо «видишь кнопку Load More — нажимай» — «сначала проверь текущий статус страницы, чтобы избежать бесконечной прокрутки, затем нажимай загрузить еще». В статье также предложена Memory-aware Test-time Scaling (MaTTS), при которой во время рассуждения выделяется больше вычислительных ресурсов для многократных попыток, а процесс исследования сохраняется в памяти. Параллельное расширение позволяет агенту запускать несколько различных маршрутов для одной задачи и извлекать более устойчивые стратегии через самосравнение; последовательное расширение внутри одного маршрута включает многократную доработку, а промежуточные рассуждения записываются в память. На двух бенчмарках — браузерной задаче WebArena и задаче с проверенными кодами SWE-Bench-Verified — при использовании ReAct-агента Gemini 2.5 Flash с ReasoningBank по сравнению с базовой моделью без памяти уровень успеха на WebArena вырос на 8,3%, на SWE-Bench-Verified — на 4,6%, при этом в среднем количество шагов сократилось примерно на 3. После добавления параллельного расширения MaTTS (k=5) уровень успеха на WebArena увеличился еще на 3 процентных пункта, а количество шагов снизилось еще на 0,4.