RL Fine-Tuning позволяет модели 4B превосходить 235B в финансовых вопросах и ответах: Snorkel AI выпускает открытую среду обучения FinQA

robot
Генерация тезисов в процессе

Согласно мониторингу 1M AI News, Snorkel AI выпустила FinQA — среду для обучения с подкреплением, построенную на реальных финансовых документах SEC 10-K; теперь она с открытым исходным кодом на платформе OpenEnv, совместно поддерживаемой Meta, PyTorch и Hugging Face. FinQA охватывает 290 экспертно аннотированных финансовых вопросов от 22 публично торгуемых компаний, включая Alphabet, Amazon, Apple, Bank of America и Boeing, предоставляя агенту четыре инструмента MCP: перечисление доступных финансовых таблиц, извлечение структур таблиц, выполнение SQL-запросов и отправку ответов. SQL задаёт условия фильтрации и запрещает SELECT *, заставляя агента получать только необходимые данные вместо выгрузки всей таблицы. Snorkel AI сотрудничала с командой rLLM в Университете Калифорнии в Беркли, чтобы дообучить Qwen3-4B с использованием FinQA, в результате чего на бенчмарке финансовых вопросов и ответов SnorkelFinance получился результат 59,7%, что превосходит ту же серию Qwen3-235B (51,37%), при этом число параметров примерно в 1/60 раз меньше, а стоимость инференса снижена на 90%. Ключевые выводы: хотя большие модели могут рассуждать, они могут генерировать галлюцинированные названия колонок и игнорировать ограничения SQL; напротив, меньшая модель, обученная с помощью RL, может точно вызывать инструменты, указывая, что «дисциплина инструментов», а не масштаб, является узким местом. FinQA — первая среда с открытым исходным кодом, выпущенная Snorkel AI на OpenEnv; в планах запуск многораундовых корпоративных сред, охватывающих такие отрасли, как здравоохранение, страхование и право, в будущем.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить