RLファインチューニングにより4Bモデルが235Bを上回る金融Q&Aを実現:Snorkel AI、オープンソースのFinQAトレーニング環境をリリース

robot
概要作成中

1M AI Newsによる監視によれば、Snorkel AIは、実際のSEC 10-Kの財務ドキュメントに基づいて構築された強化学習トレーニング環境であるFinQAをリリースした。現在、Meta PyTorchとHugging Faceが共同で運営するOpenEnvプラットフォーム上でオープンソース化されている。FinQAは、Alphabet、Amazon、Apple、Bank of America、Boeingを含む22の上場企業からの290件の専門家による注釈付きの財務質問をカバーし、エージェントに4つのMCPツール(利用可能な財務テーブルの一覧表示、テーブル構造の取得、SQLクエリの実行、回答の提出)を提供する。SQLはフィルタリング条件を強制し、SELECT *を禁止しているため、エージェントはテーブル全体を丸ごと出力するのではなく、必要なデータだけを取得することが求められる。Snorkel AIは、カリフォルニア大学バークレー校のrLLMチームと協力してFinQAを用いてQwen3-4Bを微調整し、その結果、SnorkelFinanceという財務Q&Aベンチマークで59.7%のスコアを獲得した。これは同じシリーズのQwen3-235B(51.37%)を上回るもので、パラメータ数は約1/60、推論コストは90%削減となっている。主な発見:大規模モデルは推論できる一方で、幻覚のような列名を生成したり、SQLの制約を無視したりすることがある。対照的に、RLで訓練した小型モデルはツールを正確に呼び出せるため、「スケール」ではなく「ツールの規律」がボトルネックであることが示唆される。FinQAは、Snorkel AIがOpenEnv上でリリースした最初のオープンソース環境であり、将来的にはヘルスケア、保険、法律などの業界を対象にしたマルチターンのエンタープライズ環境を立ち上げる計画がある。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン