1M AI Newsによる監視によれば、Snorkel AIは、実際のSEC 10-Kの財務ドキュメントに基づいて構築された強化学習トレーニング環境であるFinQAをリリースした。現在、Meta PyTorchとHugging Faceが共同で運営するOpenEnvプラットフォーム上でオープンソース化されている。FinQAは、Alphabet、Amazon、Apple、Bank of America、Boeingを含む22の上場企業からの290件の専門家による注釈付きの財務質問をカバーし、エージェントに4つのMCPツール(利用可能な財務テーブルの一覧表示、テーブル構造の取得、SQLクエリの実行、回答の提出)を提供する。SQLはフィルタリング条件を強制し、SELECT *を禁止しているため、エージェントはテーブル全体を丸ごと出力するのではなく、必要なデータだけを取得することが求められる。Snorkel AIは、カリフォルニア大学バークレー校のrLLMチームと協力してFinQAを用いてQwen3-4Bを微調整し、その結果、SnorkelFinanceという財務Q&Aベンチマークで59.7%のスコアを獲得した。これは同じシリーズのQwen3-235B(51.37%)を上回るもので、パラメータ数は約1/60、推論コストは90%削減となっている。主な発見:大規模モデルは推論できる一方で、幻覚のような列名を生成したり、SQLの制約を無視したりすることがある。対照的に、RLで訓練した小型モデルはツールを正確に呼び出せるため、「スケール」ではなく「ツールの規律」がボトルネックであることが示唆される。FinQAは、Snorkel AIがOpenEnv上でリリースした最初のオープンソース環境であり、将来的にはヘルスケア、保険、法律などの業界を対象にしたマルチターンのエンタープライズ環境を立ち上げる計画がある。
RLファインチューニングにより4Bモデルが235Bを上回る金融Q&Aを実現:Snorkel AI、オープンソースのFinQAトレーニング環境をリリース
1M AI Newsによる監視によれば、Snorkel AIは、実際のSEC 10-Kの財務ドキュメントに基づいて構築された強化学習トレーニング環境であるFinQAをリリースした。現在、Meta PyTorchとHugging Faceが共同で運営するOpenEnvプラットフォーム上でオープンソース化されている。FinQAは、Alphabet、Amazon、Apple、Bank of America、Boeingを含む22の上場企業からの290件の専門家による注釈付きの財務質問をカバーし、エージェントに4つのMCPツール(利用可能な財務テーブルの一覧表示、テーブル構造の取得、SQLクエリの実行、回答の提出)を提供する。SQLはフィルタリング条件を強制し、SELECT *を禁止しているため、エージェントはテーブル全体を丸ごと出力するのではなく、必要なデータだけを取得することが求められる。Snorkel AIは、カリフォルニア大学バークレー校のrLLMチームと協力してFinQAを用いてQwen3-4Bを微調整し、その結果、SnorkelFinanceという財務Q&Aベンチマークで59.7%のスコアを獲得した。これは同じシリーズのQwen3-235B(51.37%)を上回るもので、パラメータ数は約1/60、推論コストは90%削減となっている。主な発見:大規模モデルは推論できる一方で、幻覚のような列名を生成したり、SQLの制約を無視したりすることがある。対照的に、RLで訓練した小型モデルはツールを正確に呼び出せるため、「スケール」ではなく「ツールの規律」がボトルネックであることが示唆される。FinQAは、Snorkel AIがOpenEnv上でリリースした最初のオープンソース環境であり、将来的にはヘルスケア、保険、法律などの業界を対象にしたマルチターンのエンタープライズ環境を立ち上げる計画がある。