RLファインチューニングにより4Bモデルが235Bを上回る金融Q&Aを実現：Snorkel AI、オープンソースのFinQAトレーニング環境をリリース

2026-03-31 11:21:48

概要作成中

1M AI Newsによる監視によれば、Snorkel AIは、実際のSEC 10-Kの財務ドキュメントに基づいて構築された強化学習トレーニング環境であるFinQAをリリースした。現在、Meta PyTorchとHugging Faceが共同で運営するOpenEnvプラットフォーム上でオープンソース化されている。FinQAは、Alphabet、Amazon、Apple、Bank of America、Boeingを含む22の上場企業からの290件の専門家による注釈付きの財務質問をカバーし、エージェントに4つのMCPツール（利用可能な財務テーブルの一覧表示、テーブル構造の取得、SQLクエリの実行、回答の提出）を提供する。SQLはフィルタリング条件を強制し、SELECT *を禁止しているため、エージェントはテーブル全体を丸ごと出力するのではなく、必要なデータだけを取得することが求められる。Snorkel AIは、カリフォルニア大学バークレー校のrLLMチームと協力してFinQAを用いてQwen3-4Bを微調整し、その結果、SnorkelFinanceという財務Q&Aベンチマークで59.7%のスコアを獲得した。これは同じシリーズのQwen3-235B（51.37%）を上回るもので、パラメータ数は約1/60、推論コストは90%削減となっている。主な発見：大規模モデルは推論できる一方で、幻覚のような列名を生成したり、SQLの制約を無視したりすることがある。対照的に、RLで訓練した小型モデルはツールを正確に呼び出せるため、「スケール」ではなく「ツールの規律」がボトルネックであることが示唆される。FinQAは、Snorkel AIがOpenEnv上でリリースした最初のオープンソース環境であり、将来的にはヘルスケア、保険、法律などの業界を対象にしたマルチターンのエンタープライズ環境を立ち上げる計画がある。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

2 いいね